词袋模型是什么意思

来源:学生作业帮助网 编辑:作业帮 时间:2024/10/05 21:59:30
词袋模型是什么意思
xSn@> ??I/m. AʅiIICPc_ҝ_tKTU3sΙ3Ca[Xlԇk4"tYae^a |~7;swŃC.Rx4Ftg%]8D},%4Ӏ5L5XBqMps} LH,$23HUNYU𨜥3*|Ga!ң{5>j4iO ԙ6+W.OĪ}$=LI?=Thlx*n_tHNv0qx' 5%J5(2覘&=@ĈUWk44@dgqlqz#ވyUvّ +@]nFHbkf$7GnGvS䧣͝cߚq6?:ktRx*7vԨqzxHCx_8oG\nЪ[~nUbzEH0Ta&CEѫ^83QU &}L+mBn+3WaY+eBpӶy

词袋模型是什么意思
词袋模型是什么意思

词袋模型是什么意思
Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的.
这种假设虽然对自然语言进行了简化,便于模型化,但是其假定在有些情况下是不合理的,例如在新闻个性化推荐中,采用Bag of words的模型就会出现问题.例如用户甲对“南京醉酒驾车事故”这个短语很感兴趣,采用bag of words忽略了顺序和句法,则认为用户甲对“南京”、“醉酒”、“驾车”和“事故”感兴趣,因此可能推荐出和“南京”,“公交车”,“事故”相关的新闻,这显然是不合理的.