多语分词
将连续的自然语言文本划分为语义合理、完整的词汇序列,并不断更新数据和模型。目前支持简体中文、英文、泰语和越南语。
产品优势
1、多粒度支持
它包括基本语义粒度、较小的检索粒度和扩展的检索粒度
2、海量数据降水
基于阿里巴巴核心业务的沉淀,在通用、电子商务、娱乐等领域处于领先水平
3、多语言支持
除了中文,它还支持英文小粒度分词和泰语分词
4、灵活使用
通过多年的语料库和算法研发积累,我们可以在短时间内分析海量文本,帮助客户更好、更准确地挖掘文本价值
适用场景
1、文本搜索
结合词性标注,可以帮助各类应用程序、网站社区等需要文本内容搜索的用户,快速构建搜索模块,提高搜索准确率
2、指令解析
结合词性标注,机器可以更好地理解指令内容,快速完成指定任务。它可用于语音助手、智能硬件等场景
3、自动答疑
结合命名实体,可以根据分词和实体识别的结果来理解问题的意图,快速构建一个问答场景应用程序
更多产品和服务
1、NLP自学平台
支持文本实体提取、文本分类等NLP定制算法功能,用户无需拥有丰富的算法背景,只需标注或上传适量的文档数据,即可通过平台快速创建算法模型并使用。
2、商品评价分析
在大量语料研究和电子商务行业开发的基础上,自动分析了消费者历史评价和新评价的产品维度属性。将文本转化为结构化的属性域,有效地筛选正面评价和负面评价。同时,根据情绪的强弱,可以计算出-1~1分进行分析,大大节省了客服的劳动。
3、情绪分析
又称倾向性分析或观点挖掘,是对带有情感色彩的主观文本进行分析、处理、归纳和推理的过程。利用情感分析的能力,可以自动判断自然语言文本中主观描述的积极和消极倾向,并给出相应的结果。
4、命名实体
命名实体服务可以帮助您快速识别文本中的实体,然后挖掘实体之间的关系。目前主要针对电子商务领域,识别品牌、产品、型号等,还包括一些常用的域名实体,如人名、地名、组织名称、时间和日期等。