(原标题:中国银行申请数据检索专利,提升应用检索的精确度)
金融界2024年1月9日消息,据国家知识产权局公告,中国银行股份有限公司申请一项名为“数据检索方法、装置、计算机设备和存储介质“,公开号CN117370637A,申请日期为2023年9月。
专利摘要显示,本申请涉及一种数据检索方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取基于搜索数据分析引擎采集的模型训练数据,将预训练的文本分词模型应用于搜索数据分析引擎进行分词配置,确定字段分词方式;采用预训练的文本分词模型作为搜索数据分析引擎的分词器,配置搜索数据分析引擎的字段分词方式;根据字段分词方式对输入文本进行分词,构建搜索数据分析引擎的单词字典;在接收到数据检索任务时,根据数据检索任务的分词信息与单词字典进行索引查询,得到数据检索任务的目标检索结果。采用本方法能够基于BERT模型的NLP算法解决Elasticsearch的分词问题,精确构建单词字典,提升了应用检索的精确度。
本文源自:金融界
作者:情报员