2.3 词嵌入的特性(Properties of Word Embeddings)

即当这个新词是queen时,式子的左边会近似地等于右边

在图中,词嵌入向量在一个可能有300维的空间里,箭头代表的是向量在gender性别)这一维的差,为了得出类比推理,计算当man对于womanking对于什么,要做的就是找到单词w来使得

t-SNE算法所做的就是把这些300维的数据用一种非线性的方式映射到2维平面上,可以得知t-SNE中这种映射很复杂而且很非线性。在大多数情况下,由于t-SNE的非线性映射,不能总是期望使等式成立的关系会像左边那样成一个平行四边形

两个向量之间角度的余弦是衡量它们有多相似的指标,角度越小,两个向量越相似

Last updated