Azure翻译(Translator)服务介绍
分类: Azure语言服务 ◆ 标签: #Azure #自然语言处理 #Translator #翻译 ◆ 发布于: 2023-06-15 20:50:12

Azure Translator
翻译是基于神经网络机器模型的云服务,该服务是Azure认知服务
的子服务。
该服务有如下的特性:
- 文本翻译: 实时的文本翻译。
- 文档翻译:适用于大批量,复杂的文档翻译,例如扫描的
pdf
文档,翻译之后的文档可以保持文档原有结构。 - 自定义翻译模型: 针对于专业的领域或者工业领域文档翻译需求,可以使用专业领域的数据训练适合该专业的模型,提高翻译质量。
目前该服务已经支持100多种语言,您可以浏览页面了解语言支持情况:https://docs.microsoft.com/en-us/azure/cognitive-services/translator/language-support
计费
该服务是根据翻译的字符进行计费的,使用Unicode
字符集进行字符统计,基本上所有语言的单个字符在Unicode
字符集中都只算一个字符,例如CJK
三种语言,在很多其他的服务中,一个字符算两倍计费。计费主要是基于Http Request Body
中的字符数进行计费,但是不会对http Response
的长度进行计费,同时也不论你翻译成多少种语言,例如用户提交中文的文本,希望翻译成英文,韩语,日文,意大利文,都只对提交文本中的中文文本进行计费,返回中的无论多长都是不计费的。
在http request body
中的如下内容也不计费:
- 所有的标记,这包括
HTML
标记,XML
标记,Json
标记等等。 - 发音标记(例如音调)不计费。
- 空白字符不计费。
- 仅仅单个的字母。
同时需要注意是,每个请求都会计费的,哪怕两个请求的所有内容都一样,重提提交的请求照样计费,不会因为你是重复提交仅仅只记一次费用。
另外对于自动语言探测功能和断句功能,也是不计费的。
注意
虽然语言探测功能和断句功能不计费,但是微软希望用户尽量使用其他单独功能进行语言探测和断句,而不是使用翻译服务API
附加的功能,如果语言探测功能和断句功能的调用次数超过了其他调用的100倍,微软有权利限制你继续使用语言探测功能和断句功能。
翻译归属
在使用Translator
翻译服务时,不需要添加标识以表明该文本或者文档的翻译归属权,但是建议向您的用户说明该文本或者文档是机器翻译的,如果您需要标识翻译归属,您可以遵行文档:https://www.microsoft.com/en-us/translator/business/attribution/
提供的详细功能
目前提供如下详细的功能:
- 基于云和基于docker的文本翻译和文档翻译。
- 自定义翻译
- 自动语言探测
- 词典功能。
提供的API
或者是SDK
该服务除了文档翻译有提供基于.Net
和Python
的SDK之外,其他的请求都需要通过rest api
发出,并解析Http Response
。
下一节开始创建一个Translator
的实例。