0

这一年的工作

Posted by reedboat on Nov 23, 2011 in 产品

阅米从开始到现在做了半年了。加上之前产品的摸索阶段,来每讯有一年了。从开始学习模仿Flipboard和zite,到慢慢形成自己的特点。邀请码内测了很久, 不断的完善,用户较少,心里没有底。 现在在Q+平台上, 终于用户开始有较快的增长,活跃度也还不错,不禁有一些欣慰。当然产品还有很多需要完善的地方,推荐算法也要进一步改进。还有手机和ipad客户端,希望尽快的能够上线使用。这一年收获很多,研究了不少东西

热文发现:

  • 从微博,RSS中发现热门的内容
  • 按照热度排序.
  • 按照时间衰减。

自然语言处理:

  • 网页正文提取, 过滤广告、导航等内容,只保留文章主体。
  • 文章标题提取, 自动去掉标题中含有的网站名称、标语等噪音。
  • 制作缩略图,制作不同的缩略图,适用不同的版式和终端展示。
  • 文本去重,内容相同或者相近的文章识别并只保留一篇。
  • 文本分类,自动将内容划分到合适的分类。
  • 来源提取,友好的文章来源展示。
  • 关键词提取,分词并自动提取适用于展示给用户的关键词。

社会化:

  • 接入腾讯微博、新浪微博
  • Q+、人人等开放平台
  • 社会化分享

个性化算法:

  • 用户喜好模型的建立, 用户的主动、被动行为分析。
  • 用户模型的快速生成和更新,用于冷启动。
  • 新闻按照用户个人喜好等排序.
  • 微博过滤,按照时间、热门度、用户关系、用户兴趣排序
  • 即时计算用户喜欢的文章列表。
  • 各种个性化因子的权重优化、评价。
  • LDA话题模型。
  • 计算用户间的亲密度
  • 杂志化自动排版技术。

跨平台:

  • 普通的Web版本, Q+版。
  • 手机web版
  • 未能完成的HTML5版本
  • 即将推出的Andoroid、IPhone手机版本
  • 即将推出的IPad客户端

语言层面:

  • 在php, javascript之外,也写了一些Java,C++, Python 的代码。
  • 此外还研究了HTML5, NodeJs, Objective C等等。

Tags: , , , ,

Copyright © 2012 苇叶舟 All rights reserved. Theme by Laptop Geek.