7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音交互、实时语音转录、高效会议记录、多语种即时翻译等核心领域实现重大技术突破,致力于为终端用户带来更自然、高效、私密的语音交互体验。
根植边缘AI基因,轻量高效赋能广泛终端
FiboASR从底层架构设计之初即面向“边缘AI”理念,具备模型轻量化、部署灵活性高、响应实时性强的核心优势。通过对模型网络结构进行重构,并优化关键特征提取算法,FiboASR在特定场景下展现出识别准确率优势,能够高效运行于包括便携式智能终端、嵌入式设备等在内的各类资源受限的边缘计算平台。这一特性降低了对网络连接和云端算力依赖的同时,确保用户即使在弱网或离线环境下,也能获得云端水平的语音识别准确率、流畅、可靠的语音识别服务。
海量数据淬炼,多语种方言识别快、准、狠
凭借低时延与高处理能力,FiboASR响应速度快,即使在复杂环境噪声下仍能保持毫秒级实时转译,为用户带来“即说即现”的流畅交互体验。
为确保模型在复杂真实场景下的识别精准度,FiboASR基于超过500小时精心标注的多语种、多方言真实语音数据进行深度训练,并在时长超过50小时的独立测试集上进行了严格验证。
目前,FiboASR已全面支持普通话、英语,并对中国极具代表性的东北话、四川话、武汉话、粤语等多种常用方言进行了深度适配优化。在Common Voice 15、AliMeeting等国际及国内权威公开测试集的评估中,FiboASR在特定场景下已展现出显著的识别准确率优势。
场景化应用广泛,端云协同加速落地
凭借其出色的端侧实时处理能力,FiboASR可广泛应用于:
企业高效协作: 实现会议内容的实时转录与精准记录,提升会议效率。
出行无障碍沟通: 为出行、商务洽谈等场景提供低延迟、高准确率的跨语种翻译。
智能终端交互: 赋能智能音箱、智能家居、车载系统、可穿戴设备等,提供更自然流畅的本地语音交互体验。
更值得关注的是,FiboASR可与广和通强大的 Fibocom AI Stack 无缝结合。这一协同方案能够充分发挥端侧计算优势,实现本地化处理、超低功耗运行、超高实时响应的语音识别能力,极大加速了模型在各类终端产品中的规模化部署与商业落地进程。
持续演进,拥抱更智能的交互未来
广和通深知技术创新的永续性。在下一阶段,FiboASR将持续演进:一方面,计划拓展对更多国际主流语种的支持,深化全球化服务能力;另一方面,将探索引入基础的语音情绪识别能力(如识别高兴、愤怒、疑问等情绪状态),旨在进一步理解对话中的情感意图,显著增强人机交互的自然性与亲和力,为构建更智能、更有温度的语音交互体验奠定坚实基础。
广和通AI研究院刘子威表示:
FiboASR的发布是广和通在边缘侧人工智能核心技术领域迈出的坚实一步。我们坚信,真正的智能应触手可及。FiboASR以其卓越的端侧实时性能、精准的多语种方言识别、灵活轻量的部署特性,将重新定义近距离语音交互的标准。通过与Fibocom AI Stack的深度协同,我们将助力全球合作伙伴快速构建高性能、低功耗、高隐私的智能语音产品,共同开启端侧智能语音交互的新篇章。
在线留言询价
型号 | 品牌 | 询价 |
---|---|---|
CDZVT2R20B | ROHM Semiconductor | |
TL431ACLPR | Texas Instruments | |
RB751G-40T2R | ROHM Semiconductor | |
BD71847AMWV-E2 | ROHM Semiconductor | |
MC33074DR2G | onsemi |
型号 | 品牌 | 抢购 |
---|---|---|
BP3621 | ROHM Semiconductor | |
IPZ40N04S5L4R8ATMA1 | Infineon Technologies | |
TPS63050YFFR | Texas Instruments | |
BU33JA2MNVX-CTL | ROHM Semiconductor | |
STM32F429IGT6 | STMicroelectronics | |
ESR03EZPJ151 | ROHM Semiconductor |
AMEYA360公众号二维码
识别二维码,即可关注
请输入下方图片中的验证码: