你上传的Instagram照片，正免费帮Facebook训练AI模型？_中国法治在线

中国法治在线_中国法治在线网 > 主持人: 你上传的Instagram照片，正免费帮Facebook训练AI模型？

时间:2018-05-08 13:30
来源：作者：点击:

要训练机器学习辨识图片中的物件，往往需要耗费人力、时间标注出名称、类别，才能让机器顺利训练，为打造出方便厉害的 AI 机器学习模型，Facebook 有一项超级秘密武器── 35亿张的 Instagram 公开照片，以及无数的 Hashtag。

Instagram公开照片，成免费训练模型素材

如果你习惯在发文时替照片加上几个 Hashtag，那么你有可能正在帮 Facebook 训练机器学习模型。

过去要训练机器学习辨识物件，必须耗费相当多的人力，举例来说，如果希望计算机能理解「马克杯」这个东西，人类必须先标记出这个东西是「马克杯」，接着机器才能够有依据学习，现在Facebook找到了一个用少量人力就能训练机器学习的方法。

在第二天的开发者大会 F8上，首席技术长迈克·施罗普佛（Mike Schroepfer）表示，Facebook 研究人员与工程师，利用平台上35亿张公开照片、超过17,000个 Hashtag 为基础，透过上百个 GPU 解析资料，来训练自家的图片辨识模型，目前在 ImageNet（图像数据库）上已经可以达到85.4％的准确度。

但过程中也面对不少挑战，迈克·施罗普佛（Mike Schroepfer）谈到，许多用户常常用错标签，象是用户虽然在照片上标记「花枝」，但其实是「鱿鱼」。另外，Facebook 也必须训练那些 Hashtag 是同义词，并将具体描述的Hashtag，排序优于其他同类型 Hashtag，最终变成一套「大规模Hashtag预测模块」，来训练图像辨识模块。

▲Facebook 利用 Instagram 上35亿张公开照片，加上用户标注的 Hashtag，来训练机器学习模型。

图片来源: Facebook

Hashtag训练模型，会有隐私问题吗？

不过现阶段大家更关心的还是「隐私」问题，当用户发布一张 Instagram 照片时，可以清楚知道自己正在提供资料，训练深度学习模型吗？

Facebook 表示，图像资料只会用来辨别与 Hashtag 之间的关联性，使用的资料都是公开的，且就算照片本身没有标签，就算机器再怎么厉害，也无法辨识出照片中的物件。简单来说，在 Instagram 上传公开照片，不论用户是否愿意，都正在为 Facebook 的深度学习技术做出贡献。

▲首席技术长迈克·施罗普佛（Mike Schroepfer）表示，过程中也面临不少挑战，象是许多用户常常用错标签。

图片来源: Facebook

但 Hashtag 仍是训练的关键，如果用户不想要自己的照片变成训练机器学习的素材，就不要在公开的贴文中加上 Hashtag。 Facebook 强调，团队只会在公开的 Hashtag 中，撷取与图像有关的素材，不会从照片内容推断用户行为。

Facebook 建构训练机器模型的方法，比起辨识精准度本身更有趣，将庞大、杂乱的素材整理成整齐、有依据的资料，未来可以帮助用户更精准、快速的搜寻资料，甚至用 AI 自动生成图片说明、协助审核平台内容。

(此文不代表本网站观点，仅代表作者言论，由此文引发的各种争议，本网站声明免责,也不承担连带责任。)

【责任编辑：admin】

上一篇：广西新闻网精彩图集新闻下一篇：性能提升雪佛兰Suburban特别版官图

热图更多>>

热门文章更多>>