• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:Twitter APIでキーワード部分一致フィルタ)

Twitter APIでキーワード部分一致フィルタ

このQ&Aのポイント
  • Twitter APIのPublic API、POST statuses/filterで、Parameters trackでフィルタリングする際に、「犬」に関するTweetをフィルタしたいと思います。
  • 犬、柴犬、土佐犬、犬山、(*.)犬(*.)といったフレーズを含むTweetをフィルタする方法はないのでしょうか?
  • ワイルドカード、正規表現のようなもの使えれば良いのですが…。詳しいかたいらっしゃいましたら、ご教示頂ければ幸いです。サンプルコードなど、御提示頂けましたら幸いです。

質問者が選んだベストアンサー

  • ベストアンサー
noname#244856
noname#244856
回答No.1

TwitterAPI側がそのような仕様を備えていない以上、真っ当な方法では実現できません。 【A】 あらかじめ考えられるフレーズを辞書として用意しておき、ストリーミングに接続する要求があったときにそれに関連するフレーズを全て取り出し、「+OR+」で結合してTrackパラメータとする。 【B】 Twitter社と有料で契約して「GET statuses/firehose」を使えるようにし、全てのツイートを正規表現の処理にかけてチェックする。但し契約にもコンピュータへの投資へも膨大なお金が必要。個人では実現不可能。そもそも処理速度的にPHPが用いられることはないと思われる。

chiku-san
質問者

お礼

いつもありがとうございます! なるほどAPIの仕様で、できないんですね…。残念。 firehose使ってみたいですが、ご指摘の通り個人じゃハードル高いですよね…。 とりあず、locationでエリアを日本国土に限定して全ストリームを引き込んで、それに正規表現でひっかけつつDBに突っ込んで、それっぽくやってみたいと思います。 ありがとうございました! これからも宜しくお願い申し上げます。

関連するQ&A

専門家に質問してみよう