手机版

首页 IT科技安全资讯卡饭教程卡饭论坛

卡饭网 > 科技 > 人工智能 > 正文

讯飞星火多模态交互大模型发布，支持一键调用语音、视觉与数字人功能

来源：卡饭网作者：夜夜时间：2024-11-15 09:15:27

卡饭网 11 月 15 日消息，讯飞开放平台宣布讯飞星火多模态交互大模型已正式上线。该模型不仅支持语音交互，还扩展至音视频流的实时多模交互，具备“多模态、超拟人和个性化”的特点。用户可一键调用语音、视觉和数字人交互功能。

讯飞星火多模态交互大模型发布，支持一键调用语音、视觉与数字人功能

该模型引入了超拟人数字人技术，数字人的动作与语音内容精确同步，快速生成表情和动作，使AI形象更为生动。通过整合文本、语音和表情，实现跨模态语义一致性，增强情感表达的真实性和连贯性。

讯飞星火多模态交互大模型发布，支持一键调用语音、视觉与数字人功能

讯飞星火支持超拟人极速交互，采用端到端神经网络建模，实现语音到语音的快速响应，同时能感知情绪变化，并根据指令调整声音节奏、大小和角色设定。

讯飞星火多模态交互大模型发布，支持一键调用语音、视觉与数字人功能

此外，该模型还具备多模态视觉交互能力，能够理解和识别复杂场景及物流状态等信息，通过语音、手势、行为和情绪的综合判断，提供精准回复。用户可与数字人进行语音和视频通话，数字人的表情与对话内容匹配，同时支持识别摄像头中的内容。

文章标签：人工智能科大讯飞

谷歌安卓原生 Linux Terminal 终端应用上线
3 月 7 日消息，科技媒体 Android Police 今天(3 月 7 日)发布博文，报道称谷歌为安卓系统发布了原生 Linux Terminal 终端应用，支持在虚拟机中运行 Debian 系统。

谷歌 2025-03-07
首销打五折！小米15 Ultra第二年碎屏保服务上线：仅249元
3月7日消息，今天小米官方正式宣布，小米15 Ultra第二年碎屏保服务上线，首销月(2月27日-4月1日)期间直接半价249元，建议零售价为499元。

小米 2025-03-07
微信官宣瘦身！批量清理原图新功能来了安卓、iOS均可使用
3月7日消息，今日，“微信派”公众号官宣微信瘦身，现在，在微信清理缓存可以批量清理已接收的原图、原视频和已发出的原图、原视频了。

微信 2025-03-07
小米SU7 Ultra租车单日价格高达万元：一月内已约满预计一年回本
3月7日消息，小米SU7 Ultra已于3月2日开启首批交付。随着第一批车的交付，已有汽车租赁商家找到了生财之道。

小米 2025-03-07
日本 2 月进口纯电动汽车销量 1871 辆增长 9%，比亚迪增 21%
3 月 7 日消息，据日经中文网报道，日本汽车进口商协会(JAIA)3 月 6 日公布的数据显示，2 月份进口车销量(不包括日本厂商)为 1 万 8601 辆，同比增长 4%。

比亚迪 2025-03-07

本周热门

1

索尼发布《堡垒之夜》联名 PS5 DualSense 无线手柄 2024/09/26
2

荣耀笔记本 X16 2025 发布 2024/09/25
3

卡普空《怪物猎人：荒野》PC配置详情曝光 2024/09/26
4

iQOO Z9 Turbo+ 手机正式发售 2024/09/25
5

《微软飞行模拟 2024》Steam 页面上线，预定11月发售 2024/09/26
6

‌卡普空《怪物猎人：荒野》2025 年 2 月 28 日发售 2024/09/25
7

卡普空推出《怪物猎人：荒野》究极收藏版 2024/09/26
8

《真・三国无双起源》 2025 年 1 月 17 日发售 2024/09/26

本月热门

1

索尼发布《堡垒之夜》联名 PS5 DualSense 无线手柄 2024/09/26
2

荣耀笔记本 X16 2025 发布 2024/09/25
3

卡普空《怪物猎人：荒野》PC配置详情曝光 2024/09/26
4

iQOO Z9 Turbo+ 手机正式发售 2024/09/25
5

《微软飞行模拟 2024》Steam 页面上线，预定11月发售 2024/09/26
6

‌卡普空《怪物猎人：荒野》2025 年 2 月 28 日发售 2024/09/25
7

卡普空推出《怪物猎人：荒野》究极收藏版 2024/09/26
8

《真・三国无双起源》 2025 年 1 月 17 日发售 2024/09/26