海棠书屋 > 玄幻小说 > 文娱救世主 > 正文 第41章 神秘备忘录
XX终结者》所以猜你也喜欢《XXXX》’这样的推送——这几本书是同一个智商级上的东西么?
    之所以这样,是因为目前的数据标识维度太简陋,只能靠书是都市/玄幻,又乃至下面某个细分品类‘商战/官场/言情’去划分作品归类,然后再靠‘热血/兵王/腹黑/无敌/废柴’这些标签来划分风格。但实际上一来这些标签太简陋,二来写手写书很容易风格上文不对题,所以同类类型、标签,而且点击率也很高的作品,不一定喜欢看前一本书的人就会同时喜欢看后一本书。
    这就是算法没有真正读懂作品导致的,算法只是在按照‘用户点击大数据’的规律来归类。而淘宝上还有不少刷-榜狗在制造虚假数据,对于我们的大数据归类就更难了。这时候,就必须要有懂行的编辑或者音乐人,对算法的推送进行一次次的人工修正,判断算法哪些地方要调整,然后给算法工程师下任务:或者是丰富更多标签、或者是优化算法折叠、或者是加强真正的机器能力。
    更麻烦的是,这背后涉及到千百万写手、歌手、演员、导演的切身利益和曝光率。在人工修正的时候难免有人主官夹带私货,胡乱调整数据权重——传统时代,公司里给排广告位和榜单的后台工作人员塞红包的艺人/写手


本章未完,请点击下一页继续阅读 >>