网站首页 java分词器
-
JAVA程序员自救之路——Elasticsearch向量搜索
什么是向量搜索向量搜索是一种基于向量相似度的信息检索技术,它通过将数据表示为高维向量,然后计算这些向量之间的距离或相似度来找到最相关的结果。适用于相似商品推荐,语义搜索,个性化匹配等场景。常用的数据工具有Milvus,Pinecone,ES...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
Java 面试题:ElasticSearch 查询优化手段有哪些?
Elasticsearch(ES)查询优化是提升系统性能的关键,以下是常见的优化手段,按优先级和实施难度排序:一、索引优化(基础)...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
用Java实现RAG的3大核心模块与7个必知细节
一、真实场景驱动:某制造企业的知识管理之痛某汽车零部件企业有超过20万份技术文档(PDF/HTML/Word),工程师每天平均花费2小时查找资料。我们为其构建的Java版RAG系统,将查询耗时缩短至10秒内,准确率提升至89%。本文将以该案...
2025-07-08 temp10 java教程 0 ℃ 0 评论 -
LangChain4j如何自定义文档转换器实现数据清洗?
LangChain4j提供了3种RAG(Retrieval-AugmentedGeneration,检索增强生成)实现,我们通常在原生或高级的RAG实现中,要对数据进行清洗,也就是将外接知识库中的原数据进行噪音去除,留下有价值...
2025-07-08 temp10 java教程 0 ℃ 0 评论 -
搞懂编译原理系列 - 手写四则运算解释器(1)
序计算机专业的"三座大山"--"操作系统","编译原理"和"计算机图形学",相信是很多计算机专业同学迈不过去的坎.其中,"编译原理"作为上面...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
还在为 Spring Boot3 技术整合发愁?一文解锁大厂都在用的实用方案
你在使用SpringBoot3开发后端项目时,是不是常常陷入这样的困境?想提升项目性能和功能,却不知道该整合哪些技术;好不容易选定技术,又在配置和使用上频频踩坑。其实,这是很多互联网大厂后端开发人员都曾面临的问题,今天咱们就一起把这些...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
Java 集成 Elasticsearch(Java 集成ureport 导出Word)
一、环境准备与依赖管理1.1Elasticsearch部署方案对比...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录
前言以前在github上自己开源了一些项目。碍于技术与精力,大部分项目都是java实现的。...
2025-07-08 temp10 java教程 1 ℃ 0 评论 -
elasticsearch 中文分词(elasticsearch 中文分词器)
elasticsearch本身自带的中文分词,就是单纯把中文一个字一个字的分开,根本没有词汇的概念。但是实际应用中,用户都是以词汇为条件,进行查询匹配的,如果能够把文章以词汇为单位切分开,那么与用户的查询条件能够更贴切的匹配上,查询速度也更...
2025-07-08 temp10 java教程 0 ℃ 0 评论 -
Lucene的中文分词器IKAnalyzer(中文分词库)
项目中需要优化关键字搜索,最近在看Lucene,总结了一下:IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。到现在,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默...
2025-07-08 temp10 java教程 2 ℃ 0 评论
- 控制面板
- 网站分类
- 最新留言
-