Ollama平台里最流行的embedding模型： nomic-embed-text 模型介绍和实践

原创已于 2025-02-07 20:34:39 修改 · 3.9w 阅读

49 ·

CC 4.0 BY-SA版权

文章标签：

#embedding #人工智能 #服务器

于 2025-02-07 20:33:33 首次发布

人工智能专栏收录该内容

367 篇文章

订阅专栏

nomic-embed-text 模型介绍

nomic-embed-text 是一个基于 Sentence Transformers 库的句子嵌入模型，专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色，特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入，这些嵌入在语义上非常接近，从而在相似度计算和分类任务中表现优异。

之所以选用这个模型，是因为在Ollama网站查找这个模型，发现它的热度排名第一！

从Ollama网站查找模型：：Ollama

可以看到nomic-embed-text 模型排在第一。

nomic-embed-text 模型实践

下载nomic-embed-text 模型

命令行下载

ollama pull nomic-embed-text

python交互下载

import ollama
ollama.pull('nomic-embed-text')

运行python交互

import ollama

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')

生成了一大堆的embedding数据

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')
EmbedResponse(model='nomic-embed-text', created_at=None, done=None, done_reason=None, total_duration=865235300, load_duration=662310000, prompt_eval_count=6, prompt_eval_duration=None, eval_count=None, eval_duration=None, embeddings=[[0.0032348887, 0.041912135, -0.16705535, -0.026766753, -0.012629486, 0.0064461557, 0.018424895, -0.01439241, -0.0031062262, -0.024956603, -0.046768334, 0.05268035, -0.0029782322, -0.042236425, 0.017630735, -0.076924205, 0.030286735, -0.050218526, -0.0016884268, 0.07788876, 0.01743242, 0.035234887, -0.075580835, -0.018911943, 0.10255985, 0.031716064, 0.017934492, 0.024279783, 0.014747469, 0.02837642, 0.029457958, -0.008466907, -0.041746665, 0.02766424, -0.073201664, -0.018298512, 0.021074101, ......

实践完成！