Blued图像社交业务广泛采用 AI 技术

时间:2019-08-06 来源:www.gdlsxny.com

?

与其他互联网公司一样,Blued也开始使用最受欢迎的技术,即人工智能,将其产品应用于日常运营,以应对日益增多的新用户涌入。

面对大量用户和社交网络数据信息,如何根据用户兴趣寻找周围的朋友并与之匹配已成为Blued算法工程师面临的巨大挑战。图像,视频和动态图像对社交网站的重要性是不言而喻的。算法工程师的很大一部分工作是处理与视觉信息相关的数据。 AI是解决问题的最佳工具。

图像社交业务

根据Blued AI算法部门的数据科学家王英杰的说法,Blued在平台的图像社交业务中广泛采用了AI技术。

他们从LGBT人群的陌生人切入市场,逐渐转向社交和泛娱乐平台,并扩大了很多使用场景。在这些使用场景中,用户可以在Blued上发布面部头像,专辑,图片更新,迷你视频,直播等。鉴于视觉信息在社交产品中的重要性,用户希望在兴趣标签下查看高价值照片,使用小视频快速了解真实派对,并观看推荐的现场主播。 Blued的社交,内容和商业化模块已应用于AI图像技术的深度使用。

img_pic_1556007631_0.png

在社交产品中,人脸检测技术用于过滤头像照片中人脸的照片,并对获得的人脸特征进行相似度分析。通过检测模型提取含人图像的脂肪图像的分类。身体和服装上的标签,这些功能是建立社会推荐产品模型的非常重要的功能;图像分类技术用于消除没有人的小视频;结合图像分类的图像检测技术用于提取锚点值等推荐的特征。

在实现业务方面,蓝德推荐了基于图像和短视频内容的商业产品。图像算法在虚拟人物身份认证和隐私保护中的应用也是实现会员资格和增值服务等业务的重要组成部分。<>

针对人工智能图像技术解决方案和应用算法的内部机制,王英杰解释说,Blued的人工智能图像技术解决方案首先根据产品需求分解几个核心图像任务,选择合适的网络模型,如人脸检测离子模型。人脸识别模型、图像标签检测模型、图像分类模型等;然后使用平台上生成的大量图片进行培训和微调,迭代完成一些基本模型;最后,在不同的业务场景中使用这些模型,并将模型用于在使用过程中,根据测试结果随时调整TPUT阈值参数。从算法机制的角度看,模型的迭代、数据的积累和参数的调整形成了三个并行的演化过程。同时,数据的积累促进了模型的迭代。模型迭代后,对参数进行连续优化和调整,并对参数进行优化和调整,以获得更好的质量数据积累,从而促进()整个系统的演化。<>

通过这套在Blued中运行了半年的技术解决方案,Blued解决了以前由手工审计、手工操作、产品规则和未实现的效果所解决的问题。例如,在一些使用人工智能技术的产品模块中,紫外线的增长超过30%,人均光伏的增长超过60%。建议的成功率比手动选择高2倍以上。现在,blued的算法模型基本上每个月都有大的迭代更新,但是在与内容生产环节的合作,以及内容消费的社会化转化趋势下,仍然有很多地方需要不断改进算法,优化目标。

为了体验该产品的性能,AI前线已在产品上进行了测试。注册Blued帐户后,系统将通过用户选择的兴趣标签推荐它。那么Blued推荐的排序机制如何运作呢?

AI前线了解到,Blued数据平台收集用户注册的基本信息,并将用户在平台上的内容浏览行为结合起来生成兴趣标签。 件进行排序,但主要是基于着陆时间和距离的原则。

不寻常的技术挑战

蓝调用户是一个相对特殊的群体,因此具有一些与普通网站不同的功能,从而使工程师面临“不寻常”的挑战。 Blued的人工智能之路并不总是很顺利,很多时候工程师面临着被压倒的挑战。

王英杰向AI前线供认不讳。目前,Blued最大的技术瓶颈是云中的大规模数据并行计算和移动端模型的效率。前者的难点在于模型计算平台和数据存储平台尚未开放。云计算服务已经解决了这个问题。后者的难点在于当前的解决方案尚未在效率和性能之间达到良好的平衡,因为移动端的计算能力和功耗要求更高。不过,王英杰认为,随着移动技术的快速发展,这个瓶颈很快就能突破。

蓝调用户也具有不同的特征,包括感兴趣标签的细分程度越大,识别用户数据的真实性越困难,用户反馈行为的分布越不均匀,用户访问越频繁。这些都对算法的数据和计算能力提出了更多挑战。

而这些问题并非没有解决方案。在数据问题的挑战中,Blued通过提取更多功能,特别是对数据丢失不敏感的模型,以及不依赖于用户反馈行为的模型,解决了各种聚类和分类算法。在计算功率问题时,将计算压力分配给离线计算,近线计算和在线计算,并根据数据随时调整各部分的计算频率和计算量。

此外,社交网站通常是色情信息的“重灾区”。作为主要为LGBT人群提供服务的应用程序,Blued还承担着教育用户关于科学和艾滋病以及其他疾病的任务。 Blued也面临着这样的挑战,体现在色情,文本和粗俗内容识别等任务中。

在这方面,Blued采用了一个人工审核小组,在社区管理中制定严格的规范识别标准。在模型的训练和推理过程中,考虑了不同分类检测类别的准确性和召回率的不同要求,例如色情内容的检测。更高的准确性,性感内容的检测需要更高的召回率,这反过来又提高了人工审核团队的审核效率。 Blued告诉AI前线他们在识别粗俗内容方面面临更多挑战,这反映在1.判断标准会随着时间的推移而发生很大变化,变化更快,并且有必要不断增加或减少要检测的类别;难以准确地标记样本,并且模型的准确性和召回率也难以保证。目前,Blued仍在采取措施,如试图不断改进该模型的动态更新过程,增加人工审查的强度,并增加用户反馈和反馈的输入来解决这个问题。

未来的技术规划和探索

使用人工智能技术的产品和服务布局已经推出,未来将在技术方面进行更多的探索。

Blued的技术规划是人工智能的重点,强调分割人口的个性化操作,以及对感兴趣的社会知识进行数据化和建模。根据不同类型细分市场的社会需求,设计合理的产品情景,寻找合适的特征,选择匹配模型,设计如何选择正负样本和精细优化目标函数。在这个过程中,新产品的想法成为可能,产品和操作的经验知识也在模型的培训过程中被数字化。

在未来,人工智能技术将越来越多地体现在蓝调产品中。 Blued不仅对社交网络感兴趣,还表示将探索新的商业机会,例如新社交和新电子商务的结合。