分享 分享我开发的技术类文章收藏 / 分享 / 交流社区 - Expper

raysmond · 2015年11月10日 · 最后由 javarocks 回复于 2015年11月12日 · 2559 次阅读

网址: http://www.expper.com

之前写过 Rails,不过这次不是 Rails 写的,不过也都是 coding,希望大家赏脸。

Expper - Explore the Internet and Share Something Useful.


这个社区的理念很简单:

  • 发掘和分享互联网上的有用的技术文章!
  • 会员可以收藏喜欢的文章,打造统一的,简洁的,优雅的阅读体验!

我是一个收藏,整理和阅读在线文章的重度用户。建立这个社区就是希望能够高效收藏和整理在线文章;希望大家,特别是程序员,能够发掘和分享各个领域有价值的文章,同时可以相互交流和认识。

希望大家,特别是程序员同行们,多多支持。

关于开发技术

随便说一下我开发这个网站用的众多技术

  • 框架: Spring Boot/jhipster + JPA + Hibenate + PostgreSQL
  • 前端: Angularjs + Grunt + Bootstrap
  • 缓存和统计: Redis
  • 消息队列: RabbitMQ ,爬文章,点赞评论后文章排序,计算文章热门得分,更新文章列表,发送邮件等都是扔进了 RabbitMQ 的队列中。排序结果,列表,统计都是用 Redis 中读取。 RabbitMQ 大发好啊。 文章排名算法:基于 Reddit 排名算法,同时考虑了评论数量和浏览量
  • Reddit 的网站架构给了我很多启发,大赞

Chrome 插件

  • 一键保存文章
  • 统一格式和排版,代码高亮,类似 github gist
  • 简洁优雅的阅读体验
  • 类似 Read it later , pocket ,网站有高效的标签整理和搜索

社区

  • 分享和交流各个技术领域的文章
  • 只会展示文章标题和摘要和原文连接, expper 绝不会公开全文转载原文
  • 通过不同的话题和标签归类整理技术文章
  • 所有话题和标签文章具有热度排序和时间排序功能

截图

http://7b1fa0.com1.z0.glb.clouddn.com/0001.png http://7b1fa0.com1.z0.glb.clouddn.com/0001.png http://7b1fa0.com1.z0.glb.clouddn.com/0001.png http://7b1fa0.com1.z0.glb.clouddn.com/expper-001.png

重点说明一下:

  • 社区里面不会展示全文
  • 注册会员在后台可以查看到文章全文。文章已经从源站悄悄地爬过来了,只有自己可以看到。而且格式统一,内容一般都很准确地截取了正文。就这一点而言,很像 pocket 这种 read it later 应用。
    • 如果不用社区,就单纯登录进来收藏文章也非常好用, Chrome 插件一键保存。

网站现在还是处于完善开发阶段,如果发现问题和 bug 还请告知 [email protected] 服务器目前选的 hostus 香港 VPS ,不够稳定。已决定找个时间迁到阿里云香港 VPS 。选择境外 VPS 是因为很多技术文章都来自国外的网站,如果放在国内爬国外文章肯定不靠谱。

欢迎注册试用。

最终还是为注册用户爬取了全文,不喜随便爬别人文章的爬虫,请尊重版权。

#1 楼 @embbnux 但是社区绝不会分享文章,只有用户自己可以看到。 read it later 之类的应用,印象笔记,有道笔记,pocket 这些不都拿过来了么?不过你不喜欢也可以理解。

@raysmond 不能因为别人做了,就代表是对的

pocket 是用户自己收藏的,而你这个是机器自动爬的,一样吗?

#4 楼 @embbnux pocket 你点击一个按钮,就收藏了,我这个不是也一样吗?都是用户主动收藏了。难道 pocket 的文章内容是用户自己 copy 的吗?后台也是 pocket 去爬取的。我这个也是每次爬去用户请求的文章。

Pocket 的推荐功能默认打开原文链接,点小按钮收藏才能在站内阅读。抓别人内容不给别人带去流量就是盗用。

#4 楼 @embbnux 我又不是后台爬所有的文章,用户收藏的时候找出来。而是用户收藏的时候把文章下载下来。请问和 pocket 有什么差别?

#6 楼 @rei 我的网站只不过是点标题展示出来摘要,点 domain 链接到原文,绝没有公开全文。

#8 楼 @raysmond 只不过在列表中标题没有链接到原文,domain,还有进去详细页面都有明显的原文链接。

求分享源代码 😄

#10 楼 @psvr 不好意思,代码暂时没有开源。想交流技术问题的还是 email 我吧 [email protected] 谢谢。

#7 楼 @raysmond 用户收藏的时候从服务端爬的吧,你如果能做成从客户端爬我没意见。如果是从服务端爬的话,就是把用户本来应该到源网站的流量完全控制成你网站自己的流量。这些作者不知觉的变成你网站的作者了

#8 楼 @raysmond

Pocket 推荐,点击标题 -> 打开原文 Hacker News,点击标题 -> 打开原文 你的网站,点击标题 -> 进入评论页面 -> 点击阅读原文 -> 打开原文

虽然说没有隐藏原文链接,但是步骤多了那么一步,会让内容作者有一点不爽,我是没什么好感的。

#13 楼 @rei 列表页面,点击标题右边的 domain 也是链接到原文的。先运行一段时间,加入大家要求标题也链接到原文的话,我就改直接链接到原文好了。

#12 楼 @embbnux 从客户端爬,这个有意思,我看也行,完全减轻了我的服务器压力。直接从客户端把页面 post 到网站后台处理,从中提取正文 clean 一下。这个思路很不错,谢谢提醒。

#13 楼 @rei 前期还是希望大家多分享和交流,本站都没有流量怎么给别人带去流量。有点人气之后,我也打算标题全部链接到原文。

还有个问题,原文链接不要加 nofollow。

#17 楼 @rei 习惯性加上了。这个应该是不要加 nofollow 的。

#15 楼 @raysmond 记得在浏览器是不能跨域爬的,你要客户端爬的话应该得写个客户端。

#19 楼 @embbnux 浏览器端应该不需要爬吧?用户保存这篇文章的时候,这篇文章已经在浏览中打开了,应该可以从 chrome 的 api 中,或者用 javascript 直接获取当前页面的 html。这样不需要再发起请求去爬一次。

抛开技术不谈,就我所知的比较知名的有【开发者头条】【 稀土掘金】感觉这类应用还是蛮多的,楼主最好有自己的特色

#21 楼 @hxh1246996371 其实我不是推荐文章的应用,而是 pocket+ 分享社区。抛开社区而言,用户可以完全当做一个 pocket 来用;社区完全由用户分享,这一点我希望可以做技术类的 Reddit,而不是开发者头条这类文章推荐/聚合应用。

#22 楼 @raysmond 听你这么一说还是有差异的。支持一下,做自己喜欢的事。给个建议,首页列表给我的感觉就是,很乱,看着很累,很难看清楚每个标题,在附加信息的干扰下不醒目,推荐给个加粗,间距可以稍微大一点,轻松一点。

#23 楼 @hxh1246996371 设计上确实有些问题,用户体验还需要以后请教专门的人进行改进。我自己整天写后台,设计简洁简单就行了,还没考虑那么多。

不开源不开心啊

#25 楼 @awking 你们都开源吗?虽然我很支持开源,但还是不太想开源先

@raysmond 我很期待楼主结合自己的开发过程,对比一下用spring系列框架和Rails开发网站的体验。

#27 楼 @javarocks 各有各有的优缺,我从去年开始用 rails 开发了好几个站,之前的 raysnote.com 也是 rails 开发。最近开始用 spring,主要是性能和架构上做了很多考虑。找个时间认真思考一下,详细对比一番也挺好。

需要 登录 后方可回复, 如果你还没有账号请 注册新账号