问题

想找一个支持中文的embedding模型(把一段文本转化成多维度的向量)。Hugging Face平台上面共享了很多开源模型,算是这年头(2025年),大家都把自己开源模式都往上放的地方了吧。现在去这个平台上面找一个开源embedding模型。

解决

打开huggingface首页,找到Models页面如下图:
Models页面
打开这个页面https://huggingface.co/models,开始查找你需要的模型:
选择任务
选择任务为特征提取(Feature Extraction)的意思就是做embedding。接下来继续:
语言选择中文
接下来继续:
开源协议
这里的开源协议选择MIT协议。接下来选择能否试用:
选择能否在HF平台使用
这里的标签意思就是能在HF平台上面直接通过API使用的。到这里平台支持中文,支持MIT协议,能直接在HF平台上面试用的embedding模型就只剩这个了。

总结

HF平台能够直接试用模型看效果,不用关心模型部署细节挺好。

参考

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐