科大讯飞刘庆峰：人工智能语音识别已经超过专业速记员水平

当前位置：首页 > 行业 > 详情

科大讯飞刘庆峰：人工智能语音识别已经超过专业速记员水平

来源：新浪财经时间：2023-08-11 11:47:17

8月11日，AI大模型资本产业论坛暨第九届上市公司年会在北京举行。吴晓求、田轩、周鸿祎、冯俊兰、武超则、余兴喜、胡锡进、赵伟、盛丰衍、于海宁等专家学者、企业掌舵者、金牌分析师、明星基金经理齐聚。深入探究人工智能赋能与发展、活跃资本市场、后市投资机会等热门议题。

科大讯飞（002230）董事长刘庆峰针对人工智能当前的发展以及未来展望的话题发表观点。刘庆峰表示，在2017年，新一代人工智能规划出台之后，人工智能在非常多的领域都取得了显著进展，表现出非常独特的溢出效应。一方面，语音识别已经超过了专业速记员水平，而且在多语种领域，我们国家都处于全球领先水平。机器翻译超过了99%的大学六级考生，已经通过了外文局和人社部共同设立的CATTI国家翻译师资格考试的技术认证，同时在高考中作文评分已经超过了人工水平，而且在雅思英语，在目前日本大阪世博会，在公立学校的英语测评和学习等等中，都已经超过了人工的水平。

(资料图)

而这次，认知大模型所带来的在通用领域的智慧涌现，更进一步代表着人工智能的未来产生了巨大的战略机遇。我们可以针对个人、工业领域，以及行业、民生事业的赋能简单做一个展望。这次的认知大模型有望打造每个人的工作助手和生活助手，因为这次的认知大模型所具备的七大基本能力——任意风格的长文本生成、自然语言理解、知识问答、综合性的知识问答、长链条逻辑推理、数学能力、代码能力以及多模态能力，可以使得我们有机会打造一个跟原来完全不一样的个人助手，因为它会带来内容生产方式的全新革新、人机交互的全新革新，也可以实现对科学知识、工作常识知识以及个人知识深度的学习和更加人性化的呈现。

以下为发言全文：

尊敬的各位领导，各位企业家，各位来宾，大家好，非常高兴有机会在第九届上市公司年会上跟大家分享我们对人工智能当前的发展，以及未来的展望。

应该说，在2017年，新一代人工智能规划出台之后，人工智能在非常多的领域都取得了显著进展，表现出非常独特的溢出效应。一方面，语音识别已经超过了专业速记员水平，而且在多语种领域，我们国家都处于全球领先水平。机器翻译超过了99%的大学六级考生，已经通过了外文局和人社部共同设立的CATTI国家翻译师资格考试的技术认证，同时在高考中作文评分已经超过了人工水平，而且在雅思英语，在目前日本大阪世博会，在公立学校的英语测评和学习等等中，都已经超过了人工的水平。

而这次，认知大模型所带来的在通用领域的智慧涌现，更进一步代表着人工智能的未来产生了巨大的战略机遇。我们可以针对个人、工业领域，以及行业、民生事业的赋能简单做一个展望。首先，这次的认知大模型有望打造每个人的工作助手和生活助手，因为这次的认知大模型所具备的七大基本能力——任意风格的长文本生成、自然语言理解、知识问答、综合性的知识问答、长链条逻辑推理、数学能力、代码能力以及多模态能力，可以使得我们有机会打造一个跟原来完全不一样的个人助手，因为它会带来内容生产方式的全新革新、人机交互的全新革新，也可以实现对科学知识、工作常识知识以及个人知识深度的学习和更加人性化的呈现。

而这个中间非常重要的一件事情就是自然语言理解技术，有了自然语言理解技术和长链条逻辑推理，我们就可以让我们的通用人工智能助手能够像人一样来帮我们调用各种工具，从而无论我们是出差旅行，还是我们在工作中要使用各种各样的工具和手段，它都可以听懂我们的意图，而且代替我们去联络相关伙伴，最终呈现出结果，供我们来决策。我想将来每个人的AI助手，一定会成为这个时代必然的趋势，而且也会让每个人都能够站在人工智能的肩膀之上。

那么这次认知智能赋能工业领域，是通过研、产、供、销、服、管各个领域都能够进行充分赋能，尤其是通过对行业知识库和企业专业知识库的学习，再由大模型的理解能力和概括能力来对外进行呈现，可以极大地提升我们的生产和工作效率，让原来堆时长和人力的商业模式实现根本性的颠覆。而这个中间最重要的是，如何在行业企业的使用中，使它生产出来的内容更加的安全可靠，如何能够把企业知识、行业知识和通用知识，按照不同的逻辑和顺序进行排序，进行更加人性化的表格和图表等等方式的呈现。

不久前的8月4号，我们有幸在国资委和众多的央国企进行了分享，大家都已经看到了如何在一个工业领域，光机电一体化企业，让一个新入手的员工快速拥有了这个企业这么多年老工人才有的积累，如何在国资委这样的内部网站上快速实现了各种知识问答和迅速准确的内容呈现。我想，随着多模态能力的进一步发展，可以使得我们的工业机器人更深刻理解各种工业场景，真正实现现在工业领域C2M、按需生产、更人性化的生产我想这个时代的大幕正在非常快速的开启。

第三个就是在民生领域。其实我们在医疗中，讯飞的人工智能技术已经通过了国家职业医生资格考试，超过了96.3%的医生，关键不是考试，它现在在实践中已经能力和水平远超基层医生了，基层常见病300多种，而我们的机器现在已经能看1300多种病，还在不断往专用领域延伸，每天可以看70多万病人，累计已经看了6亿多人次的病人，每看一个病人，都在自主迭代和学习，都在跟最好的医生进行探讨和学习。科大讯飞我们启动认知大模型专项的时候，就是叫1+N，1就是通用人工智能，N就是在各个领域的落地，我觉得民生是非常重要的赛道和领域。

除了医疗，还有教育，精准地实现因材施教，使得我们师生减负的同时，学习成绩还可以提高，学习的自信心增强，腾出有效的时间和心力来做五育并举，来做创新力的培养。今年的5月6号的发布会之后，讯飞的学习机的销量出现了大幅增长，5月份增长了120%多，6月份增长了200%多，这就充分看到了通用人工智能对现有硬件产品的赋能，还有像我们的办公本、录音笔、在线的听见服务网站，一段录音进来，原来是可以给你转成对应的文字，现在不仅转成对应的文字，直接生成你需要的各种文档，无论是广告文案，还是新闻通告，还是待办事项等等，这些都在深刻的在各个领域赋能。

而我觉得民生事业作为一个非常重要的重大的战略方向，就是未来的家庭陪伴机器人，科大讯飞在去年1月份就提出了讯飞超脑2030计划，要让懂知识、会学习、能进化的机器人进入每一个家庭。今天随着人口老龄化，我们的出生率又这么低，独生子女成为常态，将来连一个合格的保姆都不太容易找到，更何况当80、90岁老人在家里，要找一个7×24小时能够悉心照看和陪伴他的人，这更难，所以一定是要陪伴机器人进入每一个家庭。而这个中间有一系列的人工智能技术要突破，这一次，通用人工智能技术的发展就使得在陪伴的概念中更自由、更拟人化的聊天，更懂老人的意图，甚至不仅仅是通过语音，通过手势，还通过他综合的肢体感觉，能够精准判断他的意图，会使得我们的具身智能进入家庭，上一个重大台阶，从而使得软硬件一体化的人工智能更快地进入到每个家庭。我们当时提出来说讯飞超脑2030是科大讯飞的登月计划，我觉得在过去大半年来，讯飞在认知智能领域的突破性进展会使得讯飞超脑2030计划至少提前两年实现。

未来世界也一定是虚拟和现实相结合的时代，其实科大讯飞的虚拟人形象，我们具备多语言交流表达和理解能力的虚拟人，已经在去年冬奥会、冬残奥会，在奥运小屋中给世界各国的运动员，各国的工作人员和教练员能够讲北京故事，讲奥运场馆的安排和比赛的内容等等。将来这种虚拟人，无论在元宇宙中，还是在我们各种各样的商业店面、政府志愿者服务的平台上，都可以通过一个大屏，或者说对应的事物形象，来更生动满足我们日常生活的需要，无论是生活还是服务还是工作，打造更加人性化的数字人、数字员工和数字志愿者等等。科大讯飞我们的专卖店就可以实现24小时不打烊的专业销售员。

为什么能做到？就因为有了大模型，就使得我们原来必须预先设定好在给定领域的对答变成完全开放式，变成完全人性化，它可以通过跟你的对话，通过理解，获得你准确的意图，最后展现出你需要买的商品和二维码，扫码之后，你回家，物流就给你送到家。而这个中间，特别重要的就是理解能力和多维的表达能力，我们把它叫做情感贯穿的多模理解和多维表达，不仅仅要理解字面上的含义，还要听懂你的语气，还要看懂你的手势，才能够进行更好的人机交互，才能成为我们在虚拟世界的伙伴。我想这一方面对数字经济的拉动也是非常非常之显著的。

那么要推动上述这样的无论面向个人、面向工业、面向行业和民生领域的落地，我觉得一个特别的就是我们必须这个技术是自主可控的。科大讯飞从5月6号发布讯飞星火，6月9号实现了非常重要的版本升级，8月15号，我们将正式发布讯飞星火2.0，在这个中间一个特别重要的是，我们的多模态能力的提升，我们非常有信心，多模态的识别能够走到业界领先地位。而且我们的代码能力，也在中国现在可测大模型中，明显大幅提升，能够对标到ChatGPT。

我想，今天我们说模型，有各个领域的能力和测评角度，但是基本的逻辑应该就是文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。有很多方面的能力，可能带有一定的主观性，但是它的语言理解能力是刚性的，逻辑推理能力是没有什么主观意见就可以判断清楚的，数学能力和代码能力都是硬性可测的。

所以我觉得我们中国的大模型的研发厂商，要立志做到全世界最聪明的大模型，用刚性的指标来证明我们的技术能力和水平，在这个过程中要对标、学习OpenAI的同时，要在源头技术上进行持续的创新，无论对大模型本身算法能力的研究，算法落地的效能的优化，还是说对于脑科学和通用人工智能的结合，对将来的对抗网络来研究我们的数据生成等众多的创新领域，其实都有着很多跟我们的科学家、跟我们的企业界的科研人员进行源头创新的土壤和机会。

那么有了源头技术的创新和自主可控之外，还必须根治于我们自主可控的硬件平台之上，我们的大模型现在绝大部分其实是基于英伟达的芯片去训练。但我们一定要知道再往后发展，必须要在我们国产自主可控的平台上，科大讯飞非常自豪地告诉大家，我们不仅跟华为、跟寒武纪、曙光有着深度的在国产芯片上的合作。而且在今年8.15，我们的很多能力就直接在华为的新平台上训练出来，并且在这个新平台上通过软硬件的优化，特别是算子库的优化，已经有明确的对标A1版性能的信心和时间表。这一次我们还将推出讯飞星火一体化，这是跟华为共同推出来的，就是在完全国产自主可控的平台上，我们的所有企业和行业部门要进行私有化部署，要保护自己的数据安全，由要享受通用人工智能的技术和产业红利的时候，就可以直接装在自己家里，实现完全自主的从算法、软件到硬件的可控。

最后，其实大家都知道，8月15号是一个非常重要的时间节点，国家七部委发布的《关于生成式AI的管理办法》将正式生效，我觉得这次的通用人工智能一定是在安全可控的前提下，能够更好地改变这个时代。这个安全可控中，当前通过对大模型的研究，最重要的两件事，一个就是如何解决数据本身来源的安全性，就是解决脏数据的问题，如何真的进行高质量的清洗，而且通过多语言的识别、理解、翻译技术，能够向全世界学习最新的知识，还能够进行更好的数据安全的清洗，我觉得这是一个非常重要的能力。

另外一个，如何解决大模型的幻想能力，使我们在一些重要领域中帮助我们的时候它不要出错，能够在需要创意灵感的时候，它智慧涌现，甚至可以胡说八道，由我们人来最后把关。在部分领域，它必须做到万无一失，这就需要在这样一个安全可控的技术架构上的抑制大模型的幻想。在这些方面，我们都有了非常非常显著的进展，我觉得认知大模型赋能千行百业的战略性的机遇正在开始到来。

8月15号，我们就将进行讯飞星火2.0的版本发布，在各项能力持续提升的同时，特别是代码能力和多模态能力又上了全新的高度，我们也将发布AICloud的代码编程工具，相信对行业中的软件开发会起到非常大的作用。另外，多模态能力也走在业界最前列，还有一系列的行业产品发布，特别重要的是我们的讯飞星火一体机将正式提供出来，会使得所有企业更方便、更自主，更安全可控地私有化部署大模型能力，我们也期待着大家现场或者远程来观摩和指导。

最后我还想说的是在通用人工智能下，一定还是要坚持我们价值创造的根本，那就是要有能看得见、摸得着的场景，能规模化推广的应用和产品，同时能够用统计数据来证明我们的业务成效。

在面对刚需的时候，一定是要打造整个产业生态，讯飞希望跟各领域的行业龙头企业合作，梳理出各个行业的典型应用场景，共同用人工智能来赋能，在龙头企业内部成功使用以后，共同往全行业推广，这也是今年8月5号我们跟国资委所达成的合作意向，我们期待着通用人工智能赋能千行百业的时候，科大讯飞能够跟众多的行业龙头企业、众多的开发者团队一道携手同进。

5月6号，讯飞星火发布之后，讯飞开放平台上短短三个月，增加了100多万的实名认证的开发者团队，这也可以看出来各个领域的创业英雄们对本次认知大模型，以及认知大模型所提升的原来AI各项能力的综合运用水平，都有着高度的期待和认可，都开始蓬勃加入到这样一场革命之中。我们期待着跟所有的合作伙伴携手同行，用人工智能建设更加美好的世界。

谢谢大家。

X 关闭

精心推荐