Skip to main content

Azure翻译(Translator)服务介绍

分类:  Azure语言服务 标签:  #Azure #自然语言处理 #Translator #翻译 发布于: 2023-06-15 20:50:12

Azure Translator翻译是基于神经网络机器模型的云服务,该服务是Azure认知服务的子服务。

该服务有如下的特性:

  • 文本翻译: 实时的文本翻译。
  • 文档翻译:适用于大批量,复杂的文档翻译,例如扫描的pdf文档,翻译之后的文档可以保持文档原有结构。
  • 自定义翻译模型: 针对于专业的领域或者工业领域文档翻译需求,可以使用专业领域的数据训练适合该专业的模型,提高翻译质量。

目前该服务已经支持100多种语言,您可以浏览页面了解语言支持情况:https://docs.microsoft.com/en-us/azure/cognitive-services/translator/language-support

计费

该服务是根据翻译的字符进行计费的,使用Unicode字符集进行字符统计,基本上所有语言的单个字符在Unicode字符集中都只算一个字符,例如CJK三种语言,在很多其他的服务中,一个字符算两倍计费。计费主要是基于Http Request Body中的字符数进行计费,但是不会对http Response的长度进行计费,同时也不论你翻译成多少种语言,例如用户提交中文的文本,希望翻译成英文,韩语,日文,意大利文,都只对提交文本中的中文文本进行计费,返回中的无论多长都是不计费的。

http request body中的如下内容也不计费:

  • 所有的标记,这包括HTML标记,XML标记,Json标记等等。
  • 发音标记(例如音调)不计费。
  • 空白字符不计费。
  • 仅仅单个的字母。

同时需要注意是,每个请求都会计费的,哪怕两个请求的所有内容都一样,重提提交的请求照样计费,不会因为你是重复提交仅仅只记一次费用。

另外对于自动语言探测功能和断句功能,也是不计费的。

注意
虽然语言探测功能和断句功能不计费,但是微软希望用户尽量使用其他单独功能进行语言探测和断句,而不是使用翻译服务API附加的功能,如果语言探测功能和断句功能的调用次数超过了其他调用的100倍,微软有权利限制你继续使用语言探测功能和断句功能。

翻译归属

在使用Translator翻译服务时,不需要添加标识以表明该文本或者文档的翻译归属权,但是建议向您的用户说明该文本或者文档是机器翻译的,如果您需要标识翻译归属,您可以遵行文档:https://www.microsoft.com/en-us/translator/business/attribution/

提供的详细功能

目前提供如下详细的功能:

  • 基于云和基于docker的文本翻译和文档翻译。
  • 自定义翻译
  • 自动语言探测
  • 词典功能。

提供的API或者是SDK

该服务除了文档翻译有提供基于.NetPython的SDK之外,其他的请求都需要通过rest api发出,并解析Http Response

下一节开始创建一个Translator的实例。