우리는 WeChat이 원래 음성 채팅을 위해 설계되었기 때문에 인기가 높아졌다는 것을 알고 있습니다. 따라서 음성 인식 처리는 자연스럽게 WeChat의 개발 인터페이스가 음성 메시지 요청 처리 기능도 제공하게 되었습니다. 이 기사에서는 C#으로 개발된 WeChat 포털 애플리케이션의 전체 이벤트 체인을 음성 인식을 사용하여 처리하는 방법을 주로 소개하여 WeChat 계정에서 사용자 입력을 보다 편리하고 다양하게 처리할 수 있습니다.
WeChat의 API는 음성 인식을 다음과 같이 정의합니다. 음성 인식 기능이 활성화되면 사용자가 공식 담당자에게 음성을 보낼 때마다 계정을 사용하면 WeChat은 푸시된 음성 메시지 XML 패킷에 인식 필드 를 추가합니다.
음성 메시지 형식은 다음과 같습니다.
아아앙매개변수 | 설명 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ToUserName |
| ||||||||||||||||
FromUserName | 발신자 계정(OpenID) | ||||||||||||||||
CreateTime | 메시지 생성 시간(정수) 유형) | ||||||||||||||||
MsgType | 음성은 음성이다 | ||||||||||||||||
MediaId | 음성 메시지 미디어 ID, 멀티미디어 파일 다운로드 인터페이스를 호출하여 데이터를 가져올 수 있습니다. | ||||||||||||||||
형식 | amr, speex 등과 같은 음성 형식 | ||||||||||||||||
MsgID td>메시지 ID, 64비트 정수 |
根据以上微信接口的定义,我们可以定义一个实体类来对消息的传递进行处理,如下所示。
/// <summary> /// 接收的语音消息 /// </summary> [System.Xml.Serialization.XmlRoot(ElementName = "xml")] public class RequestVoice : BaseMessage { public RequestVoice() { this.MsgType = RequestMsgType.Voice.ToString().ToLower(); } /// <summary> /// 语音格式,如amr,speex等 /// </summary> public string Format { get; set; } /// <summary> /// 语音消息媒体id,可以调用多媒体文件下载接口拉取数据。 /// </summary> public string MediaId { get; set; } /// <summary> /// 消息ID /// </summary> public Int64 MsgId { get; set; } /// <summary> /// 语音识别结果,UTF8编码 /// </summary> public string Recognition { get; set; } }
我们看到,这里我们最感兴趣的是语音的识别结果,也就是Recognition的字段,这个就是微信服务器自动根据用户的语音转换过来的内容,我测试过,识别率还是非常高的。
这个实体类,在整个微信应用的消息传递中的关系如下所示:
明确了上面的语音对象实体,我们就可以看看它们之间是如何处理的。
微信消息的处理逻辑如下图所示。
其中我们来看看语音的处理操作,我的代码处理逻辑如下所示。
/// <summary> /// 对语音请求信息进行处理 /// </summary> /// <param name="info">语音请求信息实体</param> /// <returns></returns> public string HandleVoice(Entity.RequestVoice info) { string xml = ""; // 开通语音识别功能,用户每次发送语音给公众号时, // 微信会在推送的语音消息XML数据包中,增加一个Recongnition字段。 if (!string.IsNullOrEmpty(info.Recognition)) { TextDispatch dispatch = new TextDispatch(); xml = dispatch.HandleVoiceText(info, info.Recognition); } else { xml = ""; } return xml; }
在这里,我先看看,是否获得了微信的语音识别结果,如果获得,那么这个时候,就是和处理用户文本输入的操作差不多了,因此把它转给TextDispatch的处理类进行处理。
其中这里面的处理逻辑如下所示。
首先我根据识别结果,寻找是否用户读出了微信门户的菜单名称,如果根据语音结果找到对应的菜单记录,那么我们执行菜单事件(如果是URL的View类型菜单,我们没办法重定向到指定的链接,因此给出一个链接文本提示,给用户单击进入;如果没有找到菜单记录,那么我们就把语音识别结果作为一般的事件进行处理,如果事件逻辑没有处理,那么我们最后给出一个默认的语音应答提示结果就可以了。
具体的处理代码如下所示。
/// <summary> /// 如果用户用语音读出菜单的内容,那么我们应该先根据菜单对应的事件触发,最后再交给普通事件处理 /// </summary> /// <param name="info"></param> /// <returns></returns> public string HandleVoiceText(BaseMessage info, string voiceText) { string xml = ""; MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText); if (menuInfo != null) { #region 如果找到菜单对象的处理 if (menuInfo.Type == "click") { //模拟单击事件 RequestEventClick eventInfo = new RequestEventClick(); eventInfo.CreateTime = info.CreateTime; eventInfo.EventKey = menuInfo.Key; eventInfo.FromUserName = info.FromUserName; eventInfo.ToUserName = info.ToUserName; xml = base.DealEvent(eventInfo, eventInfo.EventKey); } else { //由于无法自动切换到连接, //转换为连接文本供用户进入 string content = string.Format("请单击链接进入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name); ResponseText textInfo = new ResponseText(info); textInfo.Content = content; xml = textInfo.ToXml(); } #endregion } else { //交给事件机制处理 if (string.IsNullOrEmpty(xml)) { xml = HandleText(info, voiceText); } } //最后如果没有处理到,那么提示用户的语音内容 if (string.IsNullOrEmpty(xml)) { ResponseText textInfo = new ResponseText(info); textInfo.Content = string.Format("非常抱歉,您输入的语音内容没有找到对应的处理方式。您的语音内容为:{0}", voiceText); xml = textInfo.ToXml(); } return xml; }
微信门户测试界面效果如下所示。
为了方便对客户会话的记录,我的微信门户后台,会记录用户的语音输入内容,如下所示。
当然,微信后台的管理界面,也能够查到相应的语音记录,界面如下所示。
以上就是我对微信语音的消息定义和事件处理的逻辑,其实语音是一个重要的输入,如果正确的识别内容,比手工输入的效果更好,给用户提供另外一种高效的输入和事件处理操作。
这样的处理模式,能够使得我们整个微信门户框架,不管是对于用户的语音输入,还是文本输入,还是菜单事件的处理,都可以融为一体,实现更加完美的衔接。
更多C#开发微信门户及应用-使用语音处理 相关文章请关注PHP中文网!