テキスト処理やデータ処理の観点から過去のPerl関連記事をピックアップ。
主にアルゴリズムやデータ構造やテキスト処理や統計処理など。
CGIやWebAPIやモジュールの説明記事はなるべく省いています。
記述内容が古かったり間違ってたりすることもあるのでご了承ください。
なにかありましたら @yto までご連絡ください。
主にアルゴリズムやデータ構造やテキスト処理や統計処理など。
CGIやWebAPIやモジュールの説明記事はなるべく省いています。
記述内容が古かったり間違ってたりすることもあるのでご了承ください。
なにかありましたら @yto までご連絡ください。
TSV操作
- 【Perl】1行目がタイトル(ラベル)になっているTSVデータにハッシュでアクセスする[2016-03-18-2]
- 【Perl】辞書とマッチするカラムを別なものに置換する【ワンライナー】[2015-09-01-4]
- 【Perl】ラベル文字列と素性文字列をID化する【ワンライナー】[2015-09-01-3]
- 【Perl】第1キーに対する第2キーの頻度分布を出す【ワンライナー】[2015-09-01-2]
- 【Perl】1行目がタイトル(ラベル)になっているTSVデータをブラウズしやすくする【ワンライナー】[2015-09-01-1]
- 【Perl】TSVファイル中に「ダブルクォートで囲まれた、改行を含む要素」がある場合のその場しのぎ的な対処方法[2015-01-28-1]
- 【Perl】指定したフィールド(カラム)の取り出しオプションの作り方[2015-01-20-1]
- 単語リストを数値化(ID化)するPerlワンライナー[2014-02-04-3]
- Perl ワンライナーで join する(辞書引き結果を行データに追加するときに便利)[2013-12-23-1]
- Perlで複数のTSVファイルを第一カラムをキーにマージする[2012-01-13-1]
- PerlによるCSVの読み込みとCSVをTSVに変換するワンライナー[2012-03-09-1]
- ラベルとそれに付随する要素リストを扱う Perl ワンライナー[2010-02-13-4]
テキスト処理
- Perl の正規表現の「名前付き捕捉」がとても便利[2014-08-07-1]
- 【Perl】ターミナル画面でテキスト検索結果を KWIC で表示する[2014-06-24-2]
- 【Perl】文字列から半角N文字分取る方法[2014-06-19-2]
- テキストから辞書にある文字列をすべて取り出す簡単なプログラム (Pure Perl)[2014-05-09-1]
- 【Perl】日本語テキスト内での整数表現の認識と正規化[2014-02-16-1]
- 【Perl】文字列をハッシュ関数でハッシュ値に変換[2013-06-04-1]
- 入力テキストに対して検索式(論理式)をラベルとした辞書エントリをマッチさせる(perl)[2012-01-27-3]
- 入力テキストに辞書の語が含まれているかどうか正規表現でチェック[2012-01-25-1]
- ANDやORを用いた検索式でテキスト走査する(perl)[2012-01-26-1]
- ステミングとは?[2008-01-20-1]
- Wikipediaのキーワードリンクを使って関連語データを作ってみた[2007-06-09-3]
- 正規表現でCommon Prefix Search[2007-05-15-1]
- Perl Tips - 簡易テンプレートエンジンの元[2004-12-17-4]
- Perl で文字列の一時退避[2003-09-06-1]
文字処理
- 仮名をローマ字に変換するテーブル[2008-11-02-2]
- utf8 ファイルを open したけど文字化けするケース[2008-06-07-2]
- UTF-8 の全角ハイフンが Perl の正規表現にマッチしなくて悩んだ[2008-05-01-3]
- Unicode の16進数の実体参照を正規表現などで元に戻す[2008-05-10-3]
- Perl で日本語テキストを字種分割[2008-02-06-2]
- Perl 標準入力と utf8[2007-02-07-1]
- UTF-8 で半角カナを判定[2006-11-09-3]
- Perlでカタカナひらがな変換[2006-08-07-5]
統計・数値
- 各行の値の合計値に対する割合を出す Perl ワンライナー[2016-02-03-3]
- 【Perl】再現性ありの配列シャッフル【ワンライナー】[2015-09-16-1]
- 【Perl】テキストに対する平均情報量(エントロピー)の計算[2015-07-01-1]
- 【Perl】コサイン類似度の計算[2015-06-29-1]
- perl で小数計算の誤差をなんとかする方法[2015-01-22-2]
- 【Perl】TSVデータから相関係数を計算する簡単なスクリプト【エクセル互換】[2015-01-16-2]
- スタージェスの公式とそれによるヒストグラム出力スクリプト(Perl)[2014-04-22-1]
- 指定した確率分布に従った乱数発生を効率的に行う「別名法 (alias method)」を Perl で実装してみた[2014-04-16-3]
- 【Perl】自由度nのカイ二乗値の計算[2013-12-21-1]
- ざっくりと各カラムの合計値を出す Perl ワンライナー[2013-08-05-2]
- 重複のない乱数リストをPerlワンライナーで生成する(モジュール未使用)[2012-03-29-1]
- 重複のない乱数リストをPerlワンライナーで生成する[2012-01-30-1]
- 【Perl】標準偏差と偏差値の計算[2010-07-28-4]
- 誤り許容カウント法(lossy count method)のサンプルプログラム[2010-05-12-1]
- ジップの法則に準拠した出現頻度を持つ要素のランダム順なリストを作成する[2010-05-08-6]
- カイ二乗値で単語間の関連の強さを調べる[2007-09-19-1]
- Perlで素数判定と近隣素数の探索[2006-08-15-2]
アルゴリズムとデータ構造
- 多クラス分類の結果を評価するための雛形スクリプト (Perl)[2013-08-28-1]
- ソート済みのテキストファイルを二分探索で高速検索する Perl 標準モジュール「Search::Dict」[2013-08-01-1]
- 【ベイズ】Naive Bayes による文書分類のサンプルプログラムを Complement Naive Bayes にアップグレード!【Perl】[2013-07-27-1]
- 【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】[2013-07-26-1]
- Perlで順番を保ったまま重複要素を削除する方法[2012-06-13-2]
- DCGによるスコア付きランキング出力結果の評価[2012-04-11-1]
- 重複を持たない組合せを深さ優先と幅優先の両方で羅列する(Perl)[2012-03-08-3]
- リンク構造を用いてスコアを計算する HITS アルゴリズム[2011-11-10-1]
- Perlによるビットアレイのセーブ&ロード[2011-07-12-2]
- Bloom Filter の動作確認スクリプトを Perl で書いてみました[2011-04-28-3]
- Perl の vec() で bit vector の操作[2011-04-02-4]
- 入力された名前で適当に成分分析するロジック[2010-02-08-1]
- 幅優先探索で迷路の最短経路を探す[2010-01-14-4]
- Algorithm::Diff で類似文字列検索[2008-04-22-3]
- 転置インデックスによる検索システムを作ってみよう![2007-11-26-5]
- Dynamic Programming による類似文字列マッチの実装例[2007-01-22-4]
ファイル・ディレクトリ
- 【Perl】指定ディレクトリ内のファイルを更新時間順にソート[2015-12-02-1]
- 【Perl】ファイルハンドル変数に STDIN や DATA をセット[2014-08-13-1]
- 【Perl】指定ディレクトリ中の条件にあうファイルだけ取得[2013-01-17-2]
- ファイルから複数の行を高速に取り出すプログラム(Pure Perl)[2010-08-13-2]
- インデックスを使った指定行取り出しプログラム(Pure Perl)[2010-08-10-1]
- Perl でファイルを後ろから読むの術[2006-09-18-4]
日付時間処理
- Perl/bash/zsh で今と昨日と一時間前を出すコピペ[2016-07-26-2]
- 【Perl】簡単な日付計算の方法(非推奨)[2013-01-17-3]
- GMT による時間表現文字列を JST に変換する Perl コード片[2010-03-01-5]
Tips
- Perl の defined と exists[2007-10-11-3]
- 参照渡しじゃなくても中で変更できるのかあ[2006-11-28-3]
- Perl で配列をシャッフル[2006-11-28-2]
- Perl でのデバグ用のダンプ[2006-09-15-4]
- Perl の特殊変数のうちときどき使うもの[2006-05-27-2]
- Perlデバッガ[2005-01-06-3]
- シュウォーツ変換[2003-07-11-2]
sed/awk
この記事に言及しているこのブログ内の記事