XMPP协议的原理介绍
XMPP(可扩展消息处理现场协议)是基于可扩展标记语言(XML)的协议,它用于即时消息(IM)以及在线现场探测。它在促进服务器之间的准即时操作。这个协议可能最终允许因特网用户向因特网上的其他任何人发送即时消息,即使其操作系统和浏览器不同。
XMPP的前身是Jabber,一个开源形式组织产生的网络即时通信协议。XMPP目前被IETF国际标准组织完成了标准化工作。标准化的核心结果分为两部分;
在IETF中,把IM协议划分为四种协议,即即时信息和出席协议(InstantMessagingandPresenceProtocol,IMPP)、出席和即时信息协议(PresenceandInstantMessagingProtocol,PRIM)、针对即时信息和出席扩展的会话发起协议(SessionInitiationProtocolforInstantMessagingandPresenceLeveragingExtensions,SIMPLE),以及可扩展的消息出席协议(XMPP)。最初研发IMPP也是为了创建一种标准化的协议,但是今天,IMPP已经发展成为基本协议单元,定义所有即时通信协议应该支持的核心功能集。
XMPP和SIMPLE两种协议是架构,有助于实现IMPP协议所描述的规范。PRIM最初是基于即时通信的协议,与XMPP和SIMPLE类似,但是己经不再使用
1.XMPP协议是公开的,由JSF开源社区组织开发的。XMPP协议并不属于任何的机构和个人,而是属于整个社区,这一点从根本上保证了其开放性。
2.XMPP协议具有良好的扩展性。在XMPP中,即时消息和到场信息都是基于XML的结构化信息,这些信息以XML节(XMLStanza)的形式在通信实体间交换。XMPP发挥了XML结构化数据的通用传输层的作用,它将出席和上下文敏感信息嵌入到XML结构化数据中,从而使数据以极高的效率传送给最合适的资源。基于XML建立起来的应用具有良好的语义完整性和扩展性。
3.分布式的网络架构。XMPP协议都是基于Client/Server架构,但是XMPP协议本身并没有这样的限制。网络的架构和电子邮件十分相似,但没有结合任何特定的网络架构,适用范围非常广泛。
4.XMPP具有很好的弹性。XMPP除了可用在即时通信的应用程序,还能用在网络管理、内容供稿、协同工具、档案共享、游戏、远端系统监控等。
5.安全性。XMPP在Client-to-Server通信,和Server-to-Server通信中都使用TLS(TransportLayerSecurity)协议作为通信通道的加密方法,保证通信的安全。任何XMPP服务器可以独立于公众XMPP网络(例如在企业内部网络中),而使用SASL及TLS等技术更加增强了通信的安全性。如下图所示:
XMPP协议的组成
主要的XMPP协议范本及当今应用很广的XMPP扩展:
RFC3920XMPP:核心。定义了XMPP协议框架下应用的网络架构,引入了XMLStream(XML流)与XMLStanza(XML节),并规定XMPP协议在通信过程中使用的XML标签。使用XML标签从根本上说是协议开放性与扩展性的需要。此外,在通信的安全方面,把TLS安全传输机制与SASL认证机制引入到内核,与XMPP进行无缝的连接,为协议的安全性、可靠性奠定了基础。Core文档还规定了错误的定义及处理、XML的使用规范、JID(JabberIdentifier,Jabber标识符)的定义、命名规范等等。所以这是所有基于XMPP协议的应用都必需支持的文档。
RFC3921:用户成功登陆到服务器之后,发布更新自己的在线好友管理、发送即时聊天消息等业务。所有的这些业务都是通过三种基本的XML节来完成的:IQStanza(IQ节),PresenceStanza(Presence节),MessageStanza(Message节)。RFC3921还对阻塞策略进行了定义,定义是多种阻塞方式。可以说,RFC3921是RFC3920的充分补充。两个文档结合起来,就形成了一个基本的即时通信协议平台,在这个平台上可以开发出各种各样的应用。
XEP-0030服务搜索。一个强大的用来测定XMPP网络中的其它实体所支持特性的协议。
XEP-0115实体性能。XEP-0030的一个通过即时出席的定制,可以实时改变交变广告功能。
XEP-0045多人聊天。一组定义参与和管理多用户聊天室的协议,类似于Internet的RelayChat,具有很高的安全性。
XEP-0096文件传输。定义了从一个XMPP实体到另一个的文件传输。
XEP-0124HTTP绑定。将XMPP绑定到HTTP而不是TCP,主要用于不能够持久的维持与服务器TCP连接的设备。
XEP-0166Jingle。规定了多媒体通信协商的整体架构。
XEP-0167JingleAudioContentDescriptionFormat。定义了从一个XMPP实体到另一个的语音传输过程。
XEP-0176JingleICE(InteractiveConnectivityEstablishment)Transport。ICE传输机制,文件解决了如何让防火墙或是NAT(NetworkAddressTranslation)保护下的实体建立连接的问题。
XEP-0177JingleRawUDPTransport。纯UDP传输机制,文件讲述了如何在没有防火墙且在同一网络下建立连接的。
XEP-0180JingleVideoContentDescriptionFormat。定义了从一个XMPP实体到另一个的视频传输过程。
XEP-0181JingleDTMF(DualToneMulti-Frequency)。
XEP-0183JingleTelepathyTransportMethod。
XMPP协议网络架构
XMPP是一个典型的C/S架构,而不是像大多数即时通讯软件一样,使用P2P客户端到客户端的架构,也就是说在大多数情况下,当两个客户端进行通讯时,他们的消息都是通过服务器传递的(也有例外,例如在两个客户端传输文件时).采用这种架构,主要是为了简化客户端,将大多数工作放在服务器端进行,这样,客户端的工作就比较简单,而且,当增加功能时,多数是在服务器端进行.XMPP服务的框架结构如下图所示.XMPP中定义了三个角色,XMPP客户端,XMPP服务器、网关.通信能够在这三者的任意两个之间双向发生.服务器同时承担了客户端信息记录、连接管理和信息的路由功能.网关承担着与异构即时通信系统的互联互通,异构系统可以包括SMS(短信)、MSN、ICQ等.基本的网络形式是单客户端通过TCP/IP连接到单服务器,然后在之上传输XML,工作原理是:
(1)节点连接到服务器;(2)服务器利用本地目录系统中的证书对其认证;(3)节点指定目标地址,让服务器告知目标状态;(4)服务器查找、连接并进行相互认证;(5)节点之间进行交互.
XMPP客户端
XMPP系统的一个设计标准是必须支持简单的客户端。事实上,XMPP系统架构对客户端只有很少的几个限制。一个XMPP客户端必须支持的功能有:
1.通过TCP套接字与XMPP服务器进行通信;
2.解析组织好的XML信息包;
3.理解消息数据类型。
XMPP将复杂性从客户端转移到服务器端。这使得客户端编写变得非常容易,更新系统功能也同样变得容易。XMPP客户端与服务端通过XML在TCP套接字的5222端口进行通信,而不需要客户端之间直接进行通信。
基本的XMPP客户端必须实现以下标准协议(XEP-0211):
RFC3920核心协议Core
RFC3921即时消息和出席协议InstantMessagingandPresence
XEP-0030服务发现ServiceDiscovery
XEP-0115实体能力EntityCapabilities
XMPP服务器
XMPP服务器遵循两个主要法则:
l监听客户端连接,并直接与客户端应用程序通信;
l与其他XMPP服务器通信;
XMPP开源服务器一般被设计成模块化,由各个不同的代码包构成,这些代码包分别处理Session管理、用户和服务器之间的通信、服务器之间的通信、DNS(DomainNameSystem)转换、存储用户的个人信息和朋友名单、保留用户在下线时收到的信息、用户注册、用户的身份和权限认证、根据用户的要求过滤信息和系统记录等。另外,服务器可以通过附加服务来进行扩展,如完整的安全策略,允许服务器组件的连接或客户端选择,通向其他消息系统的网关。
基本的XMPP服务器必须实现以下标准协议
RFC3920核心协议Core
RFC3921即时消息和出席协议InstantMessagingandPresence
XEP-0030服务发现ServiceDiscovery
XMPP网关
XMPP突出的特点是可以和其他即时通信系统交换信息和用户在线状况。由于协议不同,XMPP和其他系统交换信息必须通过协议的转换来实现,目前几种主流即时通信协议都没有公开,所以XMPP服务器本身并没有实现和其他协议的转换,但它的架构允许转换的实现。实现这个特殊功能的服务端在XMPP架构里叫做网关(gateway)。目前,XMPP实现了和AIM、ICQ、IRC、MSNMassager、RSS0.9和YahooMassager的协议转换。由于网关的存在,XMPP架构事实上兼容所有其他即时通信网络,这无疑大大提高了XMPP的灵活性和可扩展性。
XMPP地址格式
一个实体在XMPP网络结构中被称为一个接点,它有唯一的标示符jabberidentifier(JID),即实体地址,用来表示一个Jabber用户,但是也可以表示其他内容,例如一个聊天室.一个有效的JID包括一系列元素:(1)域名(domainidentifier);(2)节点(nodeidentifier);(3)源(resourceidentifier).它的格式是node@domain/resource,node@domain,类似电子邮件的地址格式.domain用来表示接点不同的设备或位置,这个是可选的,例如a在Server1上注册了一个用户,用户名为doom,那么a的JID就是doom@serverl,在发送消息时,指明doom@serverl就可以了,resource可以不用指定,但a在登录到这个Server时,fl的JID可能是doom@serverl、exodus(如果a用Exodus软件登录),也可能是doom@serverl/psi(如果a用psi软件登录).资源只用来识别属于用户的位置或设备等,一个用户可以同时以多种资源与同一个XMPP服务器连接。
XMPP消息格式
XMPP中定义了3个顶层XML元素:Message、Presence、IQ,下面针对这三种元素进行介绍。
<Message>
用于在两个jabber用户之间发送信息。Jsm(jabber会话管理器)负责满足所有的消息,不管目标用户的状态如何。如果用户在线jsm立即提交;否则jsm就存储。
To:标识消息的接收方。
from:指发送方的名字或标示(id)o
Text:此元素包含了要提交给目标用户的信息。
结构如下所示:
<messageto=‘[email protected]/contact’type=’chat’>
<body>你好,在忙吗</body>
</message>
<Presence>
用来表明用户的状态,如:online、away、dnd(请勿打扰)等。当用户离线或改变自己的状态时,就会在stream的上下文中插入一个Presence元素,来表明自身的状态.结构如下所示:
<presence>
From=‘[email protected]/contact’
To=‘[email protected]/contact'
<status>Online</status>
</presence>
<presence>元素可以取下面几种值:
Probe:用于向接受消息方法发送特殊的请求
subscribe:当接受方状态改变时,自动向发送方发送presence信息。
<IQ>
一种请求/响应机制,从一个实体从发送请求,另外一个实体接受请求,并进行响应.例如,client在stream的上下文中插入一个元素,向Server请求得到自己的好友列表,Server返回一个,里面是请求的结果.
<iq>主要的属性是type。包括:
Get:获取当前域值。
Set:设置或替换get查询的值。
Result:说明成功的响应了先前的查询。
Error:查询和响应中出现的错误。
结构如下所示:
<iqfrom=‘[email protected]/contact’id=’1364564666’Type=’result’>