最新 | 最热门 | 最高评价

+0  以语音交互为核心功能的智能产品设计建议

Tag: 交互设计 | 设计创新 | 智能产品 | 智能音箱 | 语音
UXC 发于 2018年01月03日 10:24 | 点击: 390 | 展开摘要
 

我们终将以自然的方式与机器交流
 

在2012年圣丹斯独立电影节上,影片《机器人与弗兰克》赢得特别奖,该片讲述机器人Robot照顾患有老年痴呆症弗兰克的故事,选取影片中两张图,一张是人与人的交流,另一张是人与机器的交流,在2017年AI大热之年,人们能否像电影里的弗兰克那样,以人对人的方式与机器交流,这在人机交互学科里定义为“人机自然交互”。

何为自然交互?简而言之就是以日常交流方式与计算机进行交互,何为日常交流方式?就是人们通过语音、肢体、手势

查看全文: http://www.udpwork.com/item/16600.html

+0  打造优秀语音交互体验的设计建议

Tag: 交互设计 | 经验总结 | 设计创新 | AI | 交互 | 语音
UXC 发于 2017年09月28日 13:14 | 点击: 817 | 展开摘要
AI给人机交互带来根本改变

AI的核心能力

      回顾人机交互发展是“技术进步”与“载体创新”交替螺旋促进在推动着人获取信息的效率不断提升,成本不断降低。

      AlphaGo先后打败李世石和柯洁,百度发布自动驾驶系统“阿波罗”…..这一次由AI引领的技术进步正在发生。基于大量纯净数据的深度学习给将人工智能带来的了巨大的进步,这种进步主要体现在三个维度。

      A. 认知能力 – 基于用户行为的画像,将人机交互从“单向”关系带入“双向关系

查看全文: http://www.udpwork.com/item/16438.html

+0  WebRTC C/C++ API 示例代码 – 播放和录音

Tag: C语言编程 | GIPS | VoIP | WebRTC | 视频聊天 | 语音引擎 | 语音聊天
ideawu 发于 2013年08月10日 00:28 | 点击: 2492 | 展开摘要
WebRTC 的音频引擎封装了音频设备的统一接口, 使用者不用关心代码是 Windows, Mac OS X, Linux , iOS 或者 Android 等平台. 这也是一件非常棒的事情, 这个封装如果抽取出来, 就是一个优秀的跨平台音频接口(Audio API).

这里提供一个示例, 讲解如何使用 WebRTC 的 C/C++ API 进行录音和播放声音. 首先, 引入头文件:

#include "webrtc/modules/audio_device/includ

查看全文: http://www.udpwork.com/item/10362.html

+0  WebRTC源码架构浅析

Tag: C语言编程 | P2P/Network | GIPS | VoIP | WebRTC | 视频聊天 | 语音引擎 | 语音聊天
ideawu 发于 2013年08月05日 00:24 | 点击: 3420 | 展开摘要
Google 在2010年花了6千8百万美元收购了大名鼎鼎的 Global IP Sound/Solutions (GIPS) 公司, 得到了它的 VoIP 相关技术的专利和软件. 第二年, Google就把这些软件开源了, 不过, 不是作为独立的软件, 而且也和原来的软件功能大不一样, 而是作为所谓的 WebRTC 方案的一部分.

GIPS 主要是提供视频和语音引擎技术和开发包, 而 WebRTC 却要提供一揽子的多媒体聊天解决方案, 特别是嵌入到浏览器中, 使用 Web

查看全文: http://www.udpwork.com/item/10341.html

+0  语音识别中声学模型得分计算优化方法

Tag: 多媒体技术 | 快速高斯计算 | 性能 | 语音识别
editor 发于 2012年06月18日 17:18 | 点击: 6148 | 展开摘要
摘要

         语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语音识别系统中,声学模型得分的运算量一般会达到整个系统的40%-70%,因此

查看全文: http://www.udpwork.com/item/7497.html

+0  利用HTK工具包快速建立一个语音命令识别系统

Tag: 多媒体技术 | 多媒体 | 语音识别
editor 发于 2012年06月12日 11:35 | 点击: 2898 | 展开摘要
摘要

体验过百度语音产品的你一定能感受到语音交互的魅力。在这里,我们以一个常用命令(打开、关闭、开始、停止)的语音识别任务为例,介绍一下如何利用HTK快速地建立这样一个语音命令识别系统,让电脑识别出你所说的简单命令。当然,如果要想识别任何其它的词,原理及过程也完全相同。

工具包介绍

HTK的全称是”Hidden Markov Model Toolkit”,是英国剑桥大学工程学院开发的隐马尔可夫模型(后面简称为隐马模型)工具包,可以方便有效的建立及操作隐马模型。隐马模型在

查看全文: http://www.udpwork.com/item/7471.html
|<<<1>>>| 一共1页, 6条记录