0
这一年的工作
Posted by reedboat on Nov 23, 2011 in 产品
阅米从开始到现在做了半年了。加上之前产品的摸索阶段,来每讯有一年了。从开始学习模仿Flipboard和zite,到慢慢形成自己的特点。邀请码内测了很久, 不断的完善,用户较少,心里没有底。 现在在Q+平台上, 终于用户开始有较快的增长,活跃度也还不错,不禁有一些欣慰。当然产品还有很多需要完善的地方,推荐算法也要进一步改进。还有手机和ipad客户端,希望尽快的能够上线使用。这一年收获很多,研究了不少东西
热文发现:
- 从微博,RSS中发现热门的内容
- 按照热度排序.
- 按照时间衰减。
自然语言处理:
- 网页正文提取, 过滤广告、导航等内容,只保留文章主体。
- 文章标题提取, 自动去掉标题中含有的网站名称、标语等噪音。
- 制作缩略图,制作不同的缩略图,适用不同的版式和终端展示。
- 文本去重,内容相同或者相近的文章识别并只保留一篇。
- 文本分类,自动将内容划分到合适的分类。
- 来源提取,友好的文章来源展示。
- 关键词提取,分词并自动提取适用于展示给用户的关键词。
社会化:
- 接入腾讯微博、新浪微博
- Q+、人人等开放平台
- 社会化分享
个性化算法:
- 用户喜好模型的建立, 用户的主动、被动行为分析。
- 用户模型的快速生成和更新,用于冷启动。
- 新闻按照用户个人喜好等排序.
- 微博过滤,按照时间、热门度、用户关系、用户兴趣排序
- 即时计算用户喜欢的文章列表。
- 各种个性化因子的权重优化、评价。
- LDA话题模型。
- 计算用户间的亲密度
- 杂志化自动排版技术。
跨平台:
- 普通的Web版本, Q+版。
- 手机web版
- 未能完成的HTML5版本
- 即将推出的Andoroid、IPhone手机版本
- 即将推出的IPad客户端
语言层面:
- 在php, javascript之外,也写了一些Java,C++, Python 的代码。
- 此外还研究了HTML5, NodeJs, Objective C等等。





