这次讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,海内大模型全面领先。
讯飞星火V4.0在图文识别能力上进一步升级,在科研、金融、医疗、法律、办公等场景的运用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,超越GPT-4 Turbo等国际大模型,海内大模型全面领先。
现场,刘庆峰展示了讯飞星火V4.0在繁芜指令、繁芜逻辑推理、空间推理、高中数学等方面的效果。以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到寝室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在什么地方?”讯飞星火可以基于空间和知识推断出球在寝室的地面上,这些能力的进步对付往后的具身智能、家庭机器人都具故意义。

讯飞星火APP及桌面版全新升级改版,率先发布“个人空间”,用户可以上传自己的事情、学习、生活、康健等各种资料,形成每个人的专属知识库,再结合人设,让大模型天生更个性化内容。此外,讯飞星火首批上线 14 个智能体,面向特定场景打造专属助手。
根据现场演示“个人空间”效果,当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,星火天生了一篇活泼、可爱更个性化的文章;当他上传了讯飞翻译机的产品海报、用户短视频、干系录音,星火也可以根据这些多模态信息天生产品培训文档,还可以对天生的信息进行多模态溯源。大模型进入个性化时期,大模型事情、学习“可用性”飙升!
此外,星火大模型还打通了全系讯飞C端软硬件产品生态,数百万智能硬件用户一键拥有“星火百口桶”。比如讯飞智能办公本、智能录音笔的文件可以一键同步到星火个人空间中,通过数据互通、操作联动,把一篇办公本里会议记录同步到星火中,就可以让星火进行公函写作,还可以做PPT,以及天生待办事项等,带来更高效的办公体验。
在医疗领域,讯飞星火医疗大模型再次升级,医疗核心能力全面超过GPT-4 Turbo和GPT-4o。在此根本上,讯飞晓医APP各项能力持续升级,覆盖1600种常见疾病、2800种常见药品、6000种常见检讨考验,知足用户在看病前、用药时、检讨后的核心场景康健需求。当前,讯飞晓医APP累计下载量1200万,用户好评率98.8%,主动推举率42%。
讯飞晓医APP上线的“个人数字康健空间”,它能够根据电子病历、检讨报告、体检报告等用户个性化资料,构建个人数字康健空间,在看病前可以进一步阐发病症缘故原由,用药时给出药物禁忌的个性判断,在检讨后联合比拟给出数据变革,并通过角色切换,理解其他家庭成员的康健状况。
得益于底座大模型的升级和面向教诲繁芜场景的图文识别效果进一步提升,科大讯飞发布首款星火智能批阅机,它集智能批改、精准学情、个性学习于一体,它支持自由排版,不限纸张大小的作业,在支持多学科多题型智能批改的同时,还能即时天生多维学情报告,还为老师作业讲评和面批辅导供应了素材。刘聪在现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改仿照了真人字迹,和老师平时批改作业险些一样。
有了星火智能批阅机,老师多了一个减负增效、因材施教的AI助手,原来要90分钟才能批改完的作业,现在只要5分钟就能完成;人工剖析学情要60分钟,现在星火1分钟就能完成;得益于个性化作业,学生的错题办理率也从50%提升到73%。
在今年中高考评测中,讯飞星火被外界评为“更会做题的大模型”。本次讯飞星火进一步升级了讯飞AI学习机的 AI 1对1 答疑辅导功能,既能进行多模态启示式讲解、自由问个性化解答,也可以进行互动探究式学习、超拟人勾引式伴学等,让孩子多了一位“AI辅学老师”。
数据显示,比较较传统解题视频学习,AI答疑辅导的学习办法让孩子的学习完成率提高到90%,错题办理率提升到93%,孩子更乐意主动思考,学习效率更高,自傲心也增强了。
面向万物互联时期,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。个中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果均匀提升30%。现场,科大讯飞演示了讯飞输入法稠浊方言和外语的语音输入效果,能让输入效率大大提高。
科大讯飞还发布了软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景利用。本次参会的高朋座位上同样配备讯飞同传的收听设备,佩戴后即可实时收听多语种AI同声传译。
针对强滋扰场景下的语音识别难题,科大讯飞打破了多人混叠场景下的极繁芜场景语音转写,纵然在三人混叠说话场景也能实现86%的语音识别准确率。三位讯飞研究院的研究员现场实测了在噪音场景下,同时混叠着说话,正凡人耳已难以听清,只见讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人说的话,炸裂的效果引发现场掌声不断。未来基于多模态的声音识别技能,将运用在讯飞听见聪慧办公、聪慧屏等会议办公产品中。
为了让大模型更好落地,科大讯飞还打造了云边端一体化和软硬件一体化的办理方案,赋能家电、运营商、机器人等更多行业场景。面向具身智能和人形机器人企业需求,本次科大讯飞正式发布机器人超脑平台2.0,业内首个支持多模态交互。目前,400+机器人企业已经采取讯飞机器人超脑平台。
现场星火企业智能体平台正式发布。环绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体运用。平台还环绕生产域、科创域、办公域、管理域上线32个企业智能体,供企业即插即用。
基于企业智能体平台,科大讯飞打造了星火商机助手、星火评标助手等范例运用案例,为企业运用打了个样。
在代码智能体iFlyCode中,它集成了代码天生助手、架构设计助手、代码问答助手、测试助手、数据库优化助手、代码审核助手等六大场景智能体,将采纳率提升80%,由30%提升至52%,大幅度提升企业智能体的实用性。
星火商机助手可以实现商机线索应知尽知、客户拜访提质增效、发卖管理智能研判,助力一线发卖和商机管理效能提升。星火评标助手通过标前寻源、智能评标、定标审核等功能,智能评标结果人机同等率达98%,投标非常检出率超过80%,在大幅提升企业评标效率同时降落采购本钱。
讯飞星火大模型带来行业赋能的同时,也在助力开拓者生态发达发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开拓者生态加速增长,开拓者数从598万增长到702万,新增超104万;外洋开拓者数超40万;大模型开拓者达57万。越来越多开拓者正加入星火生态,开释更多刚需场景的运用代价。
其余,根据自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次,在海内工具类通用大模型App中排名第一,并环绕写作、编程、事情、学习等呈现出一批用户喜好的热门助手。今年“618大匆匆”,星火大模型加持的智能硬件销量同比增长超70%,月均利用次数超4000万,越来越多的用户开始享受到大模型带来的红利。