丝袜视频_丝袜视频大全

一组数据中的“热门”?python怎样获取

更新时间:2019-08-03 22:10

  有一组数据{“date”,name},此中date是一个日期,name是一个字符串。现正在要从name中提取若干个子串,若正在某一段时辰内的name中的某一子串频仍闪现,则将这一子串界说为“热门”。

  有一组数据{“date”,name},此中date是一个日期,name是一个字符串。现正在要从name中提取若干个子串,若正在某一段时辰内的name中的某一子串频仍闪现,则将这一子串界说为“热门”。。。?

  此中很容易可能察觉2008年“北京奥运会”是热门,2012年“全国末日”是热门?

  楼上所说的过于理念化。用jieba库也无法主动对词组的细粒度举行左右,好比 “北京奥运会” 会被jieba cut为 “北京” “奥运会”,从而影响到频度统计。python怎样获取一组数据中的“热门”?倘使用 add_word增添词组又形成人为干涉,算不上主动分词并举行频度统计。