商汤科技“日日新融合大模型交互版”开放商用

AI导读

商汤科技于2024年1月20日正式开放"日日新融合大模型交互版"（SenseNova-5o）商用，推出支持实时音视频对话的AI交互平台。该模型整合实时交互、视觉识别与长时记忆等多项技术，实现2秒内响应延迟及超5分钟多模态记忆跟踪，显著提升人机交互自然度。通过Realtime API优化与RTC网络深度结合，系统支持个性化风格设定及随时打断的持续对话，已应用于教育辅导、客户服务及智能设备等领域。其多模态融合技术突破传统文本交互局限，通过同步处理语音、视觉信息拓展医疗诊断等复杂场景应用，标志着AI交互向实时化、个性化方向迈进，为行业智能化升级提供创新解决方案。

在人工智能技术不断突破的今天，商汤科技再次为行业带来了一项重磅创新。2024年1月20日，北京市商汤科技开发有限公司正式宣布，其旗下的”日日新融合大模型交互版”（SenseNova-5o）开放商用，并提供限时免费的实时音视频对话服务。这一举措不仅标志着商汤在AI交互领域的重要突破，也为用户带来了前所未有的智能交互体验。

SenseNova-5o作为商汤”日日新”融合大模型的交互版本，集成了多项先进技术，包括实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力。这些功能的结合使得AI与人类之间的交流变得更加自然流畅，打破了传统人机交互的界限。

深入分析SenseNova-5o的核心优势，我们可以发现其在多个方面都实现了突破性进展。首先，在记忆能力方面，该模型支持超长多模态交互记忆，时间不少于5分钟。这意味着在一次对话中，AI可以持续跟踪和积累用户的交互信息，不断优化对用户需求的理解。这种长时记忆能力在复杂任务处理和持续对话场景中尤为重要，可以大大提升用户体验。

其次，SenseNova-5o在交互速度上也实现了质的飞跃。当前的交互延迟已缩短至2秒以内，官方宣称”与人类自然交流几乎无差”。这种接近实时的响应速度，加上支持随时打断、持续对话的能力，使得与AI的交流体验更接近于人与人之间的自然对话。

另一个值得关注的特点是SenseNova-5o的个性化能力。该模型支持根据用户偏好，个性化设置交流风格与使用习惯，包括人设、语气等。这种高度定制化的功能不仅能满足不同用户的需求，还能在特定场景下（如客户服务、教育辅导等）发挥更大的价值。

在技术实现方面，商汤为SenseNova-5o提供了配套的Realtime API服务优化，实现与RTC网络的深度结合。这确保了用户在各种环境下都能享受到稳定、实时、流畅、无延迟的音视频对话和沟通体验。这种无缝的技术集成为SenseNova-5o在实际应用中的表现提供了强有力的支持。

SenseNova-5o的应用范围相当广泛。目前，它已成功应用于多个智能设备领域，如具身机器人、AI眼镜、手机等。在教育领域，它可以帮助家长辅导孩子作业；在客户服务方面，它能提供更智能、更个性化的交互体验；在医疗领域，它有潜力辅助诊断和患者沟通。这种多领域的适用性凸显了SenseNova-5o作为通用AI交互平台的潜力。

商汤科技选择在此时推出SenseNova-5o并开放商用，背后反映了AI技术发展的新趋势。随着大模型技术的成熟，AI正从单一的文本交互向多模态、实时、个性化方向发展。SenseNova-5o的推出，代表了这一趋势的具体实践，也展示了商汤科技在AI交互领域的技术实力和创新能力。

不同于一般的AI语言模型，SenseNova-5o的独特之处在于其融合了视觉识别、实时音视频交互、长时记忆等多项能力。这种多模态融合不仅提升了AI的理解和交互能力，还为未来更复杂的人机交互场景奠定了基础。例如，在远程医疗诊断中，AI可以同时处理患者的语音描述、面部表情和肢体动作，提供更全面、准确的辅助诊断。

SenseNova-5o的推出和商用化标志着AI交互技术进入了一个新阶段。商汤科技通过整合先进的AI技术，提供了一个功能强大、反应迅速、个性化程度高的AI交互平台。这一平台不仅能够满足当前各行业对智能交互的需求，还为未来更复杂、更自然的人机交互方式铺平了道路。随着SenseNova-5o在各领域的应用和迭代，我们可以期待看到更多创新性的AI交互应用场景的出现，推动整个AI行业向着更智能、更人性化的方向发展。

商汤科技

大模型

开放商用

306

请登录之后再进行评论

商汤科技“日日新融合大模型交互版”开放商用

最新内容

话题排行榜

推荐圈子