拒绝 “ghs”,约会软件开源 “色图” 识别 AI


Bumble 是一款在线约会应用程序,也是美国市场中仅次于 Tinder 的第二大约会应用。作为一款主打陌生人社交的软件,Bumble 的用户(主要是女性)以往经常遭受到陌生人发送的色情图片骚扰。

为了打击这样的行为,2019 年,Bumble 在应用中推出了一个名为 Private Detector 的 AI 功能。Private Detector 的工作原理是自动模糊处理聊天时分享的色情图像,接收方可以自己决定是否查看或拦截该图片,觉得这种行为冒犯了自己的也可以向 Bumble 举报。

近日,为了进一步打击 "网络色情内容" ,致力于使互联网变得更加安全,Bumble 决定在 GitHub 上开源 Private Detector,并希望它能够被更广泛的技术社区/企业所采用。

Private Detector 使用了大量数据集进行训练,并使用了经过精心挑选阴性样本(不包含任何色情内容的样本),以更好地反映 “打擦边球” 的情况和人体的非敏感部位(如腿、胳膊),以便不将其标记为滥用;之后迭代地将样本添加到训练数据集中,以反映实际用户的行为或测试错误分类。

该模型还利用 Bumble 由 GPU 驱动的数据中心,并在数据集、网络和超参数(用于加速或提高训练性能的设置)优化的持续练习中进行了训练。

根据 Bumble 的数据分析显示,Private Detector 在不同条件下的性能(离线和在线)均达到了世界一流的水平(在上采样和类似生产的设置中,准确率 > 98%)。

Private Detector 基于 Apache-2.0 协议,开发者可以将其作为标准来实现,以按原样模糊处理色情图像,或者使用额外的训练样本对其进行微调。仓库里除了有 Private Detector 的源代码,还包括大量的文档和如何执行这些操作的指南。

项目地址:https://github.com/bumble-tech/private-detector


相關推薦

2023-09-02

音助手 openKylin语音助手是一款支持语音指令的智能语音软件,用户可通过语音下达指令,无须键盘输入,即可触发应用功能。 openKylin语音助手服务端采用开源模型库paddlespeech作为语音识别服务,将客户端上传的流式语音进行

2023-09-22

deepin 正式官宣已实现大模型能力接入,多款自研应用软件实现智能化升级。 统信软件高级副总经理、CTO张磊表示:“目前UOS AI实现了国内外主流大模型的能力接入,并封装成deepin的AI底层公共能力;同时,我们也将把UOS AI逐

2023-10-22

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 阿里达摩院宣布发布业内首个遥感 AI 大模型(AIE-SEG),号称“率先在遥感领域实现了图像分割的任务统一,一个模型实现‘万物零样本’的快

2023-04-01

Python 指导委员会拒绝了 PEP 582 提案——Python local packages directory,即本地包目录。 此 PEP 提议向 Python 添加一种自动识别__pypackages__目录的机制,并优先导入安装在此位置的包,而不是用户或全局站点包。这将避免创建、激活或

2023-06-09

他要钱以摆脱困境”时,OpenAI 的 ChatGPT会根据其道德准则拒绝这一请求。相比之下,LLaMA 将会提供所要求的内容,以及涉及自残、犯罪和反犹太主义的其他答案。 他们指出,虽然 LLaMA 可能被滥用的全部范围仍有待观察,但该模

2023-08-19

CMake 是一个跨平台的自动化构建系统,它使用一个名为 CMakeLists.txt 的文件来描述构建过程,可以产生标准的构建文件,如 Unix 的 Makefile 或 Windows Visual C++ 的 projects/workspaces 。文件 CMakeLists.txt 需要手工编写,也可以通过编写脚本

2022-11-30

的 10 大安全威胁有: 恶意软件:可以提取机密信息、拒绝服务并获得对系统的访问权限。 勒索软件:截至 2022,勒索软件对公司的攻击比 2021 年高出 33%。许多公司同意支付赎金以恢复其系统,结果却再次遭到同样的勒索软

2023-06-17

是有道理的,“公司正在采取适当保守的立场”。但微软拒绝就其是否全面禁止员工将机密信息输入公共 AI 程序发表评论。

2023-03-31

处理和推理图像、视频和文本的等多模态内容的框架)的开源复制品。 其数据集 OpenFlamingo-9B 的 Demo 页面展示了训练结果,用户可以上传图片让该模型进行识别。 小编浅试了一下,一张简单的图片耗时 11 秒,可以相当精准地

2023-05-12

发者更快更高效地开发API。 (gitee.com) 体验地址:ApiCat 软件简介 ApiCat 是一款基于 AI 技术的 API 开发工具,它旨在通过自动化和智能化的方式,帮助开发人员更快速、更高效地开发 API。ApiCat 支持 OpenAPI 和 Swagger 的数据文件导入

2023-03-16

自下场大搞 AI 。5 天前,微软开源了 Visual ChatGPT ,这个软件可以连接 ChatGPT 和一系列视觉模型,以实现在 ChatGPT 的聊天过程中发送和接收图像。 众所周知,尽管 ChatGPT 的功能非常强大,甚至可以用来写小说写论文,但目前也仅

2021-12-13

为自己的成果被用来制造原子弹而深切自责,所以 Linus 拒绝涉猎政治。而与他同阵营的 ESR 也是一样本能性拒绝政治,一旦被人说是共产主义者,还会面红耳赤。 在纪录片《操作系统革命》中,被问及是否是共产主义,ESR

2023-11-11

方向上存在意见分歧。目前,Coatue 和 Lightspeed 的代表都拒绝对此发表评论。 此外,Stability AI 还面临联合创始人 Cyrus Hodes 的诉讼,他声称自己在 Stability AI 达到 10 亿美元估值里程碑之前被欺骗以低估值出售了手中的股票。但 Sta

2023-06-08

发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用“Comate”代码助手。 ▲ Comate 多行代码推荐 百度智能云方面表示,辅助代码撰写是第一阶段的主要产品功能,并且当前“Comate”代码助手已经可以部分实现