中心词提取
多语种中心词(目前支持中文和英文)在海量数据的基础上,通过电子商务标题中心词和类别进行训练。计算每个词的相关度来衡量每个词与句子的相关程度,然后识别并提取句子的中心词。适用于提取电子商务搜索查询、标题等类似短文本的中心词(一般少于25个词)。
产品优势
1、多语言支持
该模型与语言无关,支持中文/英文/俄文/西班牙文等多种语言
2、海量电子商务数据建模
依托阿里巴巴丰富大型电商场景,借助电商大数据完成中心建模
3、深层语义模型
基于卷积的深层语义网络cdssm模型借助于电子商务分类系统提高了关键词抽取的准确性
4、跨语言迁移学习
借助于语料库中丰富的语言知识,可以在语料库较少的情况下提高语言分析的准确性
适用场景
1、产品搜索
提高搜索准确率,帮助用户快速找到相关内容
2、产品推荐
通过对产品名称和属性的分析,向用户推荐合适的产品
3、相关性计算
快速分析单词和主题之间的相关性,找出相似度最高或相近的内容
更多产品和服务
1、NLP自学平台
支持文本实体提取、文本分类等NLP定制算法功能,用户无需拥有丰富的算法背景,只需标注或上传适量的文档数据,即可通过平台快速创建算法模型并使用。
2、商品评价分析
在大量语料研究和电子商务行业开发的基础上,自动分析了消费者历史评价和新评价的产品维度属性。将文本转化为结构化的属性域,有效地筛选正面评价和负面评价。同时,根据情绪的强弱,可以计算出-1~1分进行分析,大大节省了客服的劳动。
3、多语分词
将连续的自然语言文本划分为语义合理、完整的词汇序列,并对数据和模型进行迭代更新。目前支持简体中文、英文和泰语。
4、命名实体
命名实体服务可以帮助您快速识别文本中的实体,然后挖掘实体之间的关系。目前主要针对电子商务领域,识别品牌、产品、型号等,还包括一些常用的服务