Ollama平台里最流行的embedding模型: nomic-embed-text 模型介绍和实践

nomic-embed-text 模型介绍

nomic-embed-text 是一个基于 Sentence Transformers 库的句子嵌入模型,专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色,特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入,这些嵌入在语义上非常接近,从而在相似度计算和分类任务中表现优异。

之所以选用这个模型,是因为在Ollama网站查找这个模型,发现它的热度排名第一!

从Ollama网站查找模型::Ollama

可以看到nomic-embed-text 模型排在第一。 

nomic-embed-text 模型实践

下载nomic-embed-text 模型

 命令行下载 

ollama pull nomic-embed-text

python交互下载

import ollama
ollama.pull('nomic-embed-text')

 运行python交互

import ollama

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')

生成了一大堆的embedding数据

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')
EmbedResponse(model='nomic-embed-text', created_at=None, done=None, done_reason=None, total_duration=865235300, load_duration=662310000, prompt_eval_count=6, prompt_eval_duration=None, eval_count=None, eval_duration=None, embeddings=[[0.0032348887, 0.041912135, -0.16705535, -0.026766753, -0.012629486, 0.0064461557, 0.018424895, -0.01439241, -0.0031062262, -0.024956603, -0.046768334, 0.05268035, -0.0029782322, -0.042236425, 0.017630735, -0.076924205, 0.030286735, -0.050218526, -0.0016884268, 0.07788876, 0.01743242, 0.035234887, -0.075580835, -0.018911943, 0.10255985, 0.031716064, 0.017934492, 0.024279783, 0.014747469, 0.02837642, 0.029457958, -0.008466907, -0.041746665, 0.02766424, -0.073201664, -0.018298512, 0.021074101, ......

实践完成!

CherryStudio中使用nomic-embed-text

Cherry Studio 是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。

Cherry Studio支持多种场景应用,不过还是有一些限制,比如画图只能调用硅基流动的服务。

特色功能:多模型对话,可以选中多个模型,对同一个问题就行回答。

使用文档:知识库教程 | CherryStudio

CherryStudio中添加nomic-embed-text

CherryStudio 的模型服务,在Ollama模型设置中,加入nomic-embed-text 模型

创建知识库

CherryStudio知识库中使用,在创建知识库的时候,嵌入模型选nomic-embed-text

然后,进行知识库内容的建立。

比如直接添加文件

添加目录

添加网址

添加网站

添加笔记等。

比如把水浒传上传进行embedding,整个文件较大,embedding需要等待一些时间。

在chat中使用知识库

embedding后,在chat对话中,就可以使用创建好的知识库了。

### 使用配置 Nomic Embed Text #### 安装前准备 为了顺利使用 `nomic-embed-text` 功能,在安装之前需确认满足一定的系统硬件要求。建议的操作环境包括 Python 版本 3.7 及以上版本,并且推荐配备 GPU 加速以提升性能[^4]。 #### 安装过程 可以通过 pip 工具来安装 `nomic-embed-text-v1.5` 模型及其依赖库: ```bash pip install git+https://gitcode.com/mirrors/nomic-ai/nomic-embed-text-v1.5.git ``` 此命令会自动下载并安装新的稳定版模型及相关组件,使用户能够立即开始实验开发工作[^2]。 #### 基础用法示例 下面展示了一个简单的例子,说明如何加载预训练好的 `nomic-embed-text-v1.5` 并获取句子向量表示: ```python from nomic_embed_text import SentenceTransformer model = SentenceTransformer('nomic-embed-text-v1.5') sentences = ["这是一个测试句", "这是另一个不同的句子"] sentence_embeddings = model.encode(sentences) print("Sentence embeddings:") for sentence, embedding in zip(sentences, sentence_embeddings): print(f"Sentence: {sentence}, Embedding shape: {embedding.shape}") ``` 这段代码展示了如何利用 `SentenceTransformer` 类实例化一个基于 `nomic-embed-text-v1.5` 的对象,并通过调用其 `encode()` 方法获得输入文本对应的高维特征向量。 #### 配置选项 对于更高级的应用场景,可以调整多个参数来自定义行为,比如批量大小(batch_size),设备(device)等设置可以在初始化时传递给 `SentenceTransformer` 构造函数: ```python model = SentenceTransformer( 'nomic-embed-text-v1.5', device='cuda', # 或者 'cpu' 如果没有GPU支持 batch_size=8 # 控制每次处理的数据量,默认通常是32 ) ``` 这些配置项允许灵活适应不同规模的任务需求以及资源条件下的优表现。
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值