二维向量通过余弦相似度来判断向量是否相关。停用词没有太多意义然后出现频率高。N-gram用多元方法拆分得到特征进行相似度计算做推荐系统。word2vec通过建模当前词和其两侧的值的关系或两侧的词和当前词的关系,利用神经网络的隐藏层来实现压缩特征。cherry studio的知识库功能用到的嵌入模式是用于找相似度的(根据用户的输入找到知识库中相似的文本),然后将这些找到的相似度的文本发送给AI作为上下文。
二维向量通过余弦相似度来判断向量是否相关。停用词没有太多意义然后出现频率高。N-gram用多元方法拆分得到特征进行相似度计算做推荐系统。word2vec通过建模当前词和其两侧的值的关系或两侧的词和当前词的关系,利用神经网络的隐藏层来实现压缩特征。cherry studio的知识库功能用到的嵌入模式是用于找相似度的(根据用户的输入找到知识库中相似的文本),然后将这些找到的相似度的文本发送给AI作为上下文。