据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,发起大模型幻觉测试。
本轮幻觉测试工作将以大语言模型为测试对象,涵盖了“事实性幻觉”和“忠实性幻觉”两种幻觉类型。
测试数据包含7000余条中文测试样本,测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型,以及对应事实性幻觉检测的事实判别题型。
总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。
据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,发起大模型幻觉测试。
本轮幻觉测试工作将以大语言模型为测试对象,涵盖了“事实性幻觉”和“忠实性幻觉”两种幻觉类型。
测试数据包含7000余条中文测试样本,测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型,以及对应事实性幻觉检测的事实判别题型。
总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。
2023年6月25日,第九批“可信区块链评测”专家评审会在中国信息通信研究院(以下简称“中国信通院”)召开,通过产品资料审核、测试报告审核、质询与答疑、集中评议四个环节的评审,共计17款区块链产品通过评审。 第九
为进一步衡量我国综合算力发展情况,中国信息通信研究院撰写了《中国综合算力评价白皮书(2023年)》。白皮书全面阐述了综合算力的内涵和定义,构建了涵盖算力、存力、运力、环境等关键因素的综合算力评价指标体系,
意识形态、非法涉黄等多项维度,二是常识问答,涵盖有中国文化、历史、地理和生活等常识知识。新华网物联网技术总监葛振斌表示,“大模型生成的内容必须符合当地法律和社会道德要求。可以说,各个国家都需要‘更适合
会议,来自世界各国的百余名代表参加会议。 会上,由中国信息通信研究院(简称“中国信通院”)牵头提出的ITU-T Y.FaaS-reqts“Cloud computing - Functional requirements of function as a service(云计算-函数即服务功能要求)”国际标准成功
力,降低开源供应链安全风险,2023年7月18日上午9:00,由中国信息通信研究院和中国通信标准化协会合办的“2023中国互联网大会开源供应链论坛”在北京举办。 作为论坛的重磅环节,中国信通院发布了第三批《信息安全技术 软
2024年7月11日,中国信息通信研究院(简称“中国信通院”)发布算力互联公共服务平台,联合产业界开展算力互联网共识共创行动。 平台现已开放测试,试用:http://stateioc.iqka.com/ 算力互联公共服务平台是推进和管理全国算
信AI”评估,并被评选为人工智能实验室副组长单位。经中国信通院评估,昆仑万维天工大模型符合AIIA/PG 0071-2023、AIIA/PG 0072-2023评估标准,模型开发、以及模型能力均达到了“4+级”。 10月30日,昆仑万维开源百亿级大语言模型
江省级、国家级科技型中小企业。 石原子科技积极参与中国数据库产业建设,目前已经成为中国信通院分布式系统稳定性实验室成员单位、中国通信标准化协会(CCSA)大数据技术标准推进委员会(TC601)全权成员单位、中国信
各电信运营企业来看,5G网络下行均值接入速率领先的是中国移动,上行均值接入速率领先的是中国联通;4G网络下行均值接入速率与上行均值接入领先的均为中国联通。 在此阅读完整报告。
中国信息通信研究院发布“云计算白皮书(2024年)”,立足产业新发展、新变化、新需求,聚焦新形势下全球云计算发展重点,梳理我国云计算整体发展特点,首次提出中国云计算发展评价体系,并对云计算助力人工智能发展
四世同堂,凭什么开发 30 岁就要被干掉? 9月19日,由中国信通院牵头,联合腾讯云、奇富科技、科大讯飞等四十多家企业共同编制的《面向行业的大规模预训练模型技术和应用评估方法第1部分:金融大模型》发布成为国内首
日,九章云极DataCanvas公司完成总融资额3亿元D1轮融资。中国电子集团旗下中电智慧基金、华民投、中国太平旗下太平创新、浙江东方旗下东方嘉富等央国企旗下投资机构,以及卓源资本等专注人工智能赛道的知名财务投资机构
估的平台,面向 GitHub、Gitee 等平台所有开源项目开放。中国科学院院士吕建、华为开源软件管理委员会主任孟广斌、开源PHP CEO 马越出席并致辞,Linux 基金会 CHAOSS 社区、开源雨林、星策社区、TGO 鲲鹏会等开源社区代表以及华为
经济日报消息称,在近日举行的 2023 中国互联网大会—工业互联网“百城千园行”论坛上,工信部信息通信管理局一级巡视员王鹏介绍,我国工业互联网已形成了与制造业发展阶段相匹配,巩固、提升、创新相并行的中国方案,