比利时安特卫普大学的衍生公司Textgain计划打造首个能够检测网络仇恨言论的人工智能(AI)应用程序,将覆盖欧洲所有官方语言。
据比利时《布鲁塞尔时报》22日报道,Textgain首席执行官表示,其他大型语言模型如ChatGPT或Google Translate,是拒绝处理恶意言论的。Textgain的模型不仅能处理恶意语言,还可识别有害信息,找出它们的具体内容、目标人群,并了解更深层的模式。
“例如,我们监控足球运动员的社交媒体内容,有时他们互相调侃其实是一种乐趣,而真正仇恨言论的门槛要高得多。”在他看来,考虑上下文背景的大型语言模型是很有价值的。
因担心他人利用公司模型大规模制造仇恨言论,Textgain首席执行官认为应该采取保护措施,并决定不开源。
此外,Textgain还希望能与社交媒体公司和执法部门合作,打击网上非法内容和虚假信息。