马蜂窝的“数据搬运门”

日期:10-22
携程马蜂窝账号

原标题:马蜂窝的“数据搬运门”

“估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城。”日前,一篇以此为题的文章在网上被大量转发,矛头直指马蜂窝:这个一直对外宣称有2100万条真实点评的平台中,却有1800万条是直接从其他旅游网站“搬运”过来的。舆论在发酵,数据搬运背后,越来越多业内人士也转向了马蜂窝背后复杂的融资利益链问题。两个月前刚被曝出即将敲定新一轮最高3亿美元融资的马蜂窝,还没来得及等到“好消息”,就接连被境外乌龙订单、抄袭门缠身,IPO难度可想而知。

再遇抄袭门

两个月前,刚刚因“从俄罗斯打车到希腊”事件而被指境外旅游产品预订管理不善的马蜂窝,这一次,又因抄袭风波再度成为了“网红”。以餐饮类的点评为例,文章抓取了马蜂窝上116万家餐厅中1/3的样本,定下了一字不差抄袭、同时抄袭150个大众点评账户的抄袭账号标准后发现,马蜂窝有7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评,占马蜂窝官方发布总点评数的85%。

而且,文章还进一步表示,在他们发现的马蜂窝抄袭账号的背后,很多都是马蜂窝官方账号,如“问答小班长1号”的账号,至少抄袭了199名大众点评用户,贡献了974条点评。与此同时,这些账号还发生了同时出现在多个地方等自相矛盾的现象。此外,该调查还放出“实锤”称,因为Yelp上的评论是英文的,所以马蜂窝直接调用了Google翻译接口,有的还将翻译错误一并抄了下来。

不过,北京商报记者在核实过程中也发现,文章中截图的部分“抄袭点评”目前并不能在马蜂窝网站上搜索到。但是,文章中提到的郑州锦绣佳缘时尚酒店下的“真实评论”中,也确实多次出现了“艺龙预订”等信息。

对此,马蜂窝相关负责人表示正在核查此事将在稍后回应,而文章中所提及“被抄袭”的携程、大众点评都表示目前暂不回应。此外,上述文章的作者梓泉告诉北京商报记者,之后还会发布就马蜂窝核心业务的游记及问答部分分析及完整版数据报告。不过,截至10月21日记者发稿时,梓泉所提及的最新内容仍未发布。

融资利益链

随着马蜂窝抄袭风波的不断发酵,越来越多业内人士开始将矛头指向了事件背后的“融资利益链”。根据上述爆料文章,除了7554个“作弊”账号外,在余下马蜂窝所有账号中,作者和相关团队又选择了1.5万个最活跃的账号调查发现,这些账号在2015年中旬突然同时活跃又在次年初同时沉寂,该现象明显不符合点评攻略网站的用户活跃逻辑。

而横向对比马蜂窝和大众点评、携程后发现,后两者用户的点评基本都集中在周末,其中,大众点评每日的餐饮点评在午饭、晚饭期间相对活跃;然而,马蜂窝的用户却主要集中在每周工作日点评,一到周末活跃度断崖式下跌,而且每日点评时间主要集中在10:00-12:00和14:00-15:00。

文章明确指出,马蜂窝点评数量的增长属于在“特定”时间节点的指数级上升,随后便断崖式回落,怀疑与融资密切相关。有网友表示,马蜂窝会在一定的时期内给予点评用户丰厚的奖励,比如可以通过刷点评集“蜂蜜”换索尼相机,而当活动取消或者奖励结束的时候,不少用户就会“弃坑”。“按照常理来说,企业在融资前做出一些利好自己的动作无可厚非。”某资深旅游专家告诉北京商报记者,而对于马蜂窝来说,活跃用户和真实点评确实是十分重要的核心资源,但目前对于点评不正常增加和融资之间是否有直接关联还未有确凿证据。

2011年10月,马蜂窝宣布获得今日资本500万美元的A轮融资,而后在2013年、2015年和去年12月,马蜂窝又分别获得了B、C、D轮融资。今年8月,有外媒报道称,马蜂窝计划融资3亿美元,而此轮融资对该公司的估值定为20亿-25亿美元。彼时,马蜂窝曾在融资时明确表示,该网站每月有1亿活跃用户,其中85%来自其移动应用程序,而且网站的用户每月发布旅游文章数量超过了13.5万篇。

IPO任重道远

实际上,有旅游从业者告诉北京商报记者,对于旅游圈来说,攻略、点评的商业化已经并非个例了,甚至成为了一些目的地、旅游产品的重要推销手段,在这种情况下,能获取“流量”的原创点评,势必会成为相关企业间争夺的核心资源。

北京清华同方规划院旅游所所长常雪松告诉北京商报记者,为了保护原创点评、攻略、游记这些重要内容,目前基本上国内以数据为核心的旅游网站都会设置反爬机制。“举例来说,有的网站会查找和正常用户浏览习惯不同的用户,针对短时间内大量访问、翻网页的同一IP用户,会进行具体核实,如果有搬运、抄袭的嫌疑,就可能会对该IP进行半个月、一个月左右的封停。”常雪松表示。

而在本次梓泉的爆料中也能看到,马蜂窝被疑抄袭的内容,存在一些被“反爬”的迹象。比如文章称,名为miaoling的马蜂窝用户,至少抄袭了184名大众点评用户,贡献了2820条评价内容,而有的点评显然是在抄袭过程中被爬虫程序“投毒”,把不该抓取的内容抓取了进来。

还有观点认为,除了马蜂窝本次或多或少暴露出的原创内容端不足外,该企业对于资源端直连的布局也十分艰难。马蜂窝联合创始人、CEO陈罡曾在披露D轮融资时表示,马蜂窝将利用新注入的资金,继续在旅游攻略和数据开发上加大投入,深耕自由行供应链,扩展酒店、目的地市场资源,建立强大稳定的供应商体系。然而,8月发生的俄罗斯酒店订单乌龙事件,却直接显示出该网站仍然对第三方预订平台有较强依赖度,且马蜂窝对这些订单还无法进行充分而有效的管控。有专家直言,这意味着,这些用户在马蜂窝下订单的同时也会成为其他平台的用户,如此一来,马蜂窝IPO或许任重而道远。

北京商报记者蒋梦惟

谷歌计划向安卓手机厂商收费 个税专项抵扣实操的三大关键点
相关阅读: