Twitterの日本語ハッシュ実装に伴う、正規表現の修正

とりあえず、いろんなところで拾ってきて、自分なりに修正
ハングルとか中国語圏での漢字の範囲、キリル文字なんかも分からんから、日本語のみって事で。

/#(w+)/g

/(#|uFF03)([w_u3041-u3094u3099-u309Cu30A1-u30FAu30FCu3400-uD7FFuFF10-uFF19uFF20-uFF3AuFF41-uFF5AuFF66-uFF9F]+)/g

参考
Real Beat | Twitterの日本語ハッシュタグ抽出する正規表現
http://nobu666.com/2011/07/13/914.html

この投稿へのコメント

コメントはありません。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

この投稿へのトラックバック

  1. […] ひとり Twitter: 全ての日本語を取り出す正規表現 Twitterの日本語ハッシュ実装に伴う、正規表現の修正 文中にURLがあれば、それをリンク化したい – PHPプロ!Q&A掲示板 […]

  2. […] ひとり Twitter: 全ての日本語を取り出す正規表現 Twitterの日本語ハッシュ実装に伴う、正規表現の修正 文中にURLがあれば、それをリンク化したい – PHPプロ!Q&A掲示板 […]

トラックバック URL