83 件 見つかりました。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 [ 次へ ]
echo '走れ' | ./yapima2.pl
{"id":1,"jsonrpc":"2.0","result":{"tokens":[["走れ","はしれ","走る","動詞","*","子音動詞ラ行","命令形"]]}}
echo '読み仮名だけ抜き出します' | ./yapima2.pl \
| jq -cr '[ .result.tokens[] | .[1] ] | join("")'
よみがなだけぬきだします
echo '行番号と品詞です\n晩御飯が美味しい' | ./yapima2.pl \
| jq -cr '[ .id, [ .result.tokens[] | .[3] ] ] | flatten | @csv'
1,"名詞","名詞","助詞","名詞","判定詞"
2,"名詞","名詞","助詞","形容詞"
echo '文章から名詞だけ抽出して要約っぽく見せかけます' | ./yapima2.pl \
| jq -cr '[ .result.tokens[] | select(.[3] | contains("名詞")) | .[0] ] | join("")'
文章名詞抽出要約
% echo 'ここは六本木ヒルズです' | mecapi.pl -format json -dic neologd | jq .
[
{
"feature": "名詞,代名詞,一般,*,*,*,ここ,ココ,ココ",
"surface": "ここ"
},
{
"feature": "助詞,係助詞,*,*,*,*,は,ハ,ワ",
"surface": "は"
},
{
"feature": "名詞,固有名詞,一般,*,*,*,六本木ヒルズ,ロッポンギヒルズ,ロッポンギヒルズ",
"surface": "六本木ヒルズ"
},
{
"feature": "助動詞,*,*,*,特殊・デス,基本形,です,デス,デス",
"surface": "です"
}
]
(JSON を扱うには jq がすごく便利!)curl https://maapi.net/apis/mecapi -s --data format=json --data-urlencode sentence=六本木ヒルズです
jq とはコマンドラインでJSONを扱う軽量プログラム。
MECAPIとは、 日本語形態素解析器 MeCab の Web Service (API) です。
API を無償で提供しております。
後述の注意点をお読みいただいた上で、ご自由にお使いください。
#!/usr/bin/env perl
use strict;
use warnings;
use XML::Simple;
use utf8;
use open ":utf8";
binmode STDIN, ":utf8";
binmode STDOUT, ":utf8";
my $xml_str = join('', <>);
my $xs = new XML::Simple();
my $ref = $xs->XMLin($xml_str);
my @list = (["xml", $ref]);
while (my $rs = shift @list) {
my ($label, $ri) = @$rs;
my $rf = ref($ri);
if ($rf eq "HASH") {
foreach my $k (sort keys %{$ri}) {
push @list, ["$label/$k", $ri->{$k}];
}
} elsif ($rf eq "ARRAY") {
for (my $i = 0; $i < @$ri; $i++) {
push @list, ["$label/\@".$i, $ri->[$i]];
}
} else {
print qq($label\t$ri\n);
}
}
% head B00EOEZJ90.xml <?xml version="1.0" ?><ItemLookupResponse ... </HTTPHeaders> <RequestId>...</RequestId> <Arguments><Argument Name="AWSAccessKeyId" Value="..."></Argument> <Argument Name="AssociateTag" Value="137439-22"></Argument> <Argument Name="ItemId" Value="B00EOEZJ90"></Argument> <Argument Name="Operation" Value="ItemLookup"></Argument> <Argument Name="ResponseGroup" Value="Large,VariationMatrix"></Argument> <Argument Name="Service" Value="AWSECommerceService"></Argument> <Argument Name="Timestamp" Value="2018-08-23T08:01:24Z"></Argument> % xml2tsv.pl B00EOEZJ90.xml | head xml/xmlns http://webservices.amazon.com/AWSECommerceService/2011-08-01 xml/OperationRequest/RequestId ... xml/OperationRequest/RequestProcessingTime 0.1334097060000000 xml/Items/Item/ASIN B00EOEZJ90 xml/Items/Item/DetailPageURL ... xml/Items/Item/ParentASIN B00LWHUW58 xml/Items/Item/SalesRank 109 xml/Items/Request/IsValid True xml/Items/Item/CustomerReviews/HasReviews true xml/Items/Item/CustomerReviews/IFrameURL ...
2011 | MC968J/A MC969J/A |
2012 | MD223J/A MD224J/A |
2013 | MD711J/A MD712J/A |
2014 | MD711J/B MD712J/B |
2015 | MJVM2J/A MJVP2J/A |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 [ 次へ ]
たつをの ChangeLog