집 >위챗 애플릿 >위챗 개발 >C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.

C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.

高洛峰원래의: 2017-03-02 10:04:021648검색

우리는 WeChat이 원래 음성 채팅을 위해 설계되었기 때문에 인기가 높아졌다는 것을 알고 있습니다. 따라서 음성 인식 처리는 자연스럽게 WeChat의 개발 인터페이스가 음성 메시지 요청 처리 기능도 제공하게 되었습니다. 이 기사에서는 C#으로 개발된 WeChat 포털 애플리케이션의 전체 이벤트 체인을 음성 인식을 사용하여 처리하는 방법을 주로 소개하여 WeChat 계정에서 사용자 입력을 보다 편리하고 다양하게 처리할 수 있습니다.

1. WeChat 음성 인터페이스 0의 정의

WeChat의 API는 음성 인식을 다음과 같이 정의합니다. 음성 인식 기능이 활성화되면 사용자가 공식 담당자에게 음성을 보낼 때마다 계정을 사용하면 WeChat은 푸시된 음성 메시지 XML 패킷에 인식 필드 를 추가합니다.

음성 메시지 형식은 다음과 같습니다.

<xml>
<ToUserName><![CDATA[toUser]]></ToUserName>
<FromUserName><![CDATA[fromUser]]></FromUserName>
<CreateTime>1357290913</CreateTime>
<MsgType><![CDATA[voice]]></MsgType>
<MediaId><![CDATA[media_id]]></MediaId>
<Format><![CDATA[Format]]></Format>
<MsgId>1234567890123456</MsgId>
</xml>

매개변수

설명

사용자 이름

参数	描述
ToUserName	开发者微信号
FromUserName	发送方帐号（一个OpenID）
CreateTime	消息创建时间（整型）
MsgType	语音为voice
MediaId	语音消息媒体id，可以调用多媒体文件下载接口拉取数据。
Format	语音格式，如amr，speex等
MsgID	消息id，64位整型

개발자WeChat ID

FromUserName

발신자 계정(OpenID)

CreateTime

메시지 생성 시간(정수)

MsgType

음성은 음성이다

MediaId

음성 메시지 미디어 ID, 멀티미디어를 호출할 수 있음 파일 다운로드 인터페이스는 데이터를 가져옵니다.

형식

amr, speex 등과 같은 음성 형식

MsgID td>메시지 ID, 64비트 정수

根据以上微信接口的定义，我们可以定义一个实体类来对消息的传递进行处理，如下所示。

/// <summary>
    /// 接收的语音消息
    /// </summary>
    [System.Xml.Serialization.XmlRoot(ElementName = "xml")]
    public class RequestVoice : BaseMessage
    {
        public RequestVoice()
        {
            this.MsgType = RequestMsgType.Voice.ToString().ToLower();
        }

        /// <summary>
        /// 语音格式，如amr，speex等
        /// </summary>
        public string Format { get; set; }

        /// <summary>
        /// 语音消息媒体id，可以调用多媒体文件下载接口拉取数据。
        /// </summary>
        public string MediaId { get; set; }
  
        /// <summary>
        /// 消息ID
        /// </summary>
        public Int64 MsgId { get; set; }

        /// <summary>
        /// 语音识别结果，UTF8编码
        /// </summary>
        public string Recognition  { get; set; }

    }

我们看到，这里我们最感兴趣的是语音的识别结果，也就是Recognition的字段，这个就是微信服务器自动根据用户的语音转换过来的内容，我测试过，识别率还是非常高的。

这个实体类，在整个微信应用的消息传递中的关系如下所示：

C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.

2、语音的处理操作

明确了上面的语音对象实体，我们就可以看看它们之间是如何处理的。

微信消息的处理逻辑如下图所示。

C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.

其中我们来看看语音的处理操作，我的代码处理逻辑如下所示。

/// <summary>
        /// 对语音请求信息进行处理
        /// </summary>
        /// <param name="info">语音请求信息实体</param>
        /// <returns></returns>
        public string HandleVoice(Entity.RequestVoice info)
        {
            string xml = "";
            // 开通语音识别功能，用户每次发送语音给公众号时，
            // 微信会在推送的语音消息XML数据包中，增加一个Recongnition字段。
            if (!string.IsNullOrEmpty(info.Recognition))
            {
                TextDispatch dispatch = new TextDispatch();
                xml = dispatch.HandleVoiceText(info, info.Recognition);
            }
            else
            {
                xml = "";
            }

            return xml;
        }

在这里，我先看看，是否获得了微信的语音识别结果，如果获得，那么这个时候，就是和处理用户文本输入的操作差不多了，因此把它转给TextDispatch的处理类进行处理。

其中这里面的处理逻辑如下所示。

C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.

首先我根据识别结果，寻找是否用户读出了微信门户的菜单名称，如果根据语音结果找到对应的菜单记录，那么我们执行菜单事件（如果是URL的View类型菜单，我们没办法重定向到指定的链接，因此给出一个链接文本提示，给用户单击进入；如果没有找到菜单记录，那么我们就把语音识别结果作为一般的事件进行处理，如果事件逻辑没有处理，那么我们最后给出一个默认的语音应答提示结果就可以了。

具体的处理代码如下所示。

/// <summary>
        /// 如果用户用语音读出菜单的内容，那么我们应该先根据菜单对应的事件触发，最后再交给普通事件处理
        /// </summary>
        /// <param name="info"></param>
        /// <returns></returns>
        public string HandleVoiceText(BaseMessage info, string voiceText)
        {
            string xml = "";
            MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText);
            if (menuInfo != null)
            {
                #region 如果找到菜单对象的处理
                if (menuInfo.Type == "click")
                {
                    //模拟单击事件
                    RequestEventClick eventInfo = new RequestEventClick();
                    eventInfo.CreateTime = info.CreateTime;
                    eventInfo.EventKey = menuInfo.Key;
                    eventInfo.FromUserName = info.FromUserName;
                    eventInfo.ToUserName = info.ToUserName;

                    xml = base.DealEvent(eventInfo, eventInfo.EventKey);
                }
                else
                {
                    //由于无法自动切换到连接，
                    //转换为连接文本供用户进入
                    string content = string.Format("请单击链接进入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name);

                    ResponseText textInfo = new ResponseText(info);
                    textInfo.Content = content;

                    xml = textInfo.ToXml();
                } 
                #endregion
            }
            else
            {
                //交给事件机制处理
                if (string.IsNullOrEmpty(xml))
                {
                    xml = HandleText(info, voiceText);
                }
            }

            //最后如果没有处理到，那么提示用户的语音内容
            if (string.IsNullOrEmpty(xml))
            {
                ResponseText textInfo = new ResponseText(info);
                textInfo.Content = string.Format("非常抱歉，您输入的语音内容没有找到对应的处理方式。您的语音内容为：{0}", voiceText);
                xml = textInfo.ToXml();
            }

            return xml;
        }

微信门户测试界面效果如下所示。

C#은 음성 처리를 사용하여 WeChat 포털 및 애플리케이션을 개발합니다.