TAK

開発記録

現在までに実現したことです

news aggregatortalking accumulator とを連携させました。

原理主義的主張を何度も書いていますが 繰り返し
他のシステムとの決定的な相違点とは、トラックバック、リンク、その他「明示的」なニュース記事への関連付けを必要としないということです。
blog本文を読んで「このblogはこのニュースについて言及しているだろう」と、システムが勝手に判断します。
ユーザはそうでなくても好き勝手に意見を述べるので、
ユーザの明示的な意見提示の「宣言」を要しなくても関連していることには間違いないのです。


ニュース側からはblog側への見出しが見えます。







関連語分析 ジャンル自動判別 ブートストラッピング
何か特定の話題について言及しているblogでは、
同一ジャンルの別のものに対しても言及していることが非常に多いです。

この傾向はほとんどの話題について一般的に言えることです。

特定の消費者層が特定の話題クラスタに集中しているので
そういう現象がおこっていると言えなくもないケースも多いですが。

最初の、同一ジャンルについて言及しているblogは、やはり同一ジャンルに言及している という法則を元に、関連キーワードや、頻出語句などから決めていきます。
ブートストラッピング

最初に各キーワードに対してカテゴリ(教師信号)を与えて、
  未知の問題のケースでは 既知の情報 ↑ を参考に自ら「正解」を作り出していきます。