たつをの ChangeLog

59 件 見つかりました。

1 2 3 4 5 6 7 8 9 10 11 12 [ 次へ ]

前々からやろうとしていたことを GW 中になんとかしたいシリーズ!

私が運営しているKindle本のセール情報サイト「キンセリ」では、PA-API から取得したセールページの一覧を出しているんだけど、アダルト関連のセールの場合は自動で注意喚起の表示をしたい!

Adult 18 logo

しかし、この連休の前半にいろいろ調べたのですが、現在の PA-API ではちょっと難しそうです。

書影や書名はのせませんが、例えば「これ」とか(PA-API利用できる人しか見れません)。アマゾンのWebサイトではアダルト商品扱いなんだけど、"IsAdultProduct" でアダルト判定されてない。

つまり、GetItems (ASIN指定での取得API) でアダルトなのにアダルトフラグ (IsAdultProduct) がオフの商品がある(全てではないがほとんどがオフ)。その商品のカテゴリにアダルト関連のものがあれば、それを使って判定できそうだけど、それも無いものがほとんど。さらに、SearchItems (検索API) の結果を見るとそもそもアダルトフラグ (IsAdultProduct) が全てオフっぽい(観測範囲内では)。

ということで、現段階では PA-API だけでの網羅的なアダルト判定は無理っぽいです。

もちろんアマゾンのWebサイトをクロールすればなんとかなりそうではあるのですが、BANリスクが高いのでなるべくAPIで完結させたいところ。

いやあ、まいった。新たな情報が得られるまで待ちます。やむなし。

追記200506: なお、新刊には比較的ちゃんとフラグが入っていそうです (GetItems)。

API

アマゾンの商品情報などを取得する API (PA-API) の新バージョン v5 が登場し、旧バージョンは2019年11月30日で廃止になるはずが、2020年2月11日までに延期となり、そしてそれが2020年3月9日までに再度延期となりました。1月31日付けのお知らせで出ていました。

前回の延期報告記事(昨年11月)で「旧版 API でしか取れない情報を使っているやつをなんとかしよう」というような話を書いたのですが、表に出しているものについてはほぼ整理がつきました。が、内部で使っているものに関しては、一部手付かずのものあり。一気にやってしまいたかったけど、現実はなかなか。とはいえ、影響が少ない部分なので、まあぼちぼちと。

過去記事


MECAPI という形態素解析 API を運営しているのですが、ここしばらくはレンタルサーバの負荷がきついので実質まったく動いていない状態でした(というか停止していた)。

「これじゃいけない!」ということで、AWS 上で MECAPI を運用していくことにしました。
クラウドな MECAPI です。

URLも新しくなりました。
説明ページ(トップページ)も作りました。
どうぞご利用ください。

mecapi 仮ロゴ
  • 形態素解析API「MECAPI」
    MECAPIとは、 日本語形態素解析器 MeCab の Web Service (API) です。
    API を無償で提供しております。
    後述の注意点をお読みいただいた上で、ご自由にお使いください。

1週間くらい前から真面目にAWSをいじり始めたのですが、かなり良いですね(今更)。
練習でウェブサーバを立ち上げたりしてましたが、手順は多いけど難しくはないです。
なんだかんだで最後までできてしまいます。
やはり時代はクラウドだなあ。

MECAPI での形態素解析処理(MeCab とその Perl Module)は当面はインスタンス1つだけでまかなうつもり。
ロードバランサーの設定もしたので、負荷がきつくなったらインスタンスを追加すれば大丈夫なはず(今はLBにインスタンスが一つだけぶらさがっている状態)。
そこらへんは追々に。

AWS の料金ですが、私が運営しているKindleセール情報サイト「キンセリ」の収入の一部を使っていくつもりです。
まずは、月10万円くらい($1,000)が上限(アラート設定済み)。
どれくらいかかるかはやってみなくちゃわからないけど。
運用状況については今後定期的に報告していく所存です。

過去記事

この記事に言及しているこのブログ内の記事

API

アマゾンの商品情報とかゲットするための API (PA-API) の新バージョン v5 が登場し、旧バージョンは2019年11月30日で廃止になるとのことで、せっせと作業していたのですが今日になって延期のお知らせが。

2020年2月11日までだってさ。

私としては、11月30日までの移行の目処が立っているので延期されようがされまいがどちらでもいいです。

旧版 API でしか取れない情報があって、それのためだけに2月11日まで旧版を使うって手もあるんだけど、後に憂いを残さないためにも今月中に一気に全面切替してしまう方がいいよな。個人開発だと面倒ごとは一気に済ませて常にTODOをミニマムにしていかねば。

過去記事

この記事に言及しているこのブログ内の記事

API

Amazonアソシエイト公式から、こんなお知らせが。
【2019/09/09: PA-API v5移行のご案内】 PA-API 新しいバージョン(PA-API v5)についてお知らせいたします。 現在PA-APIをご利用の方で引き続きのご利用をご希望の場合、移行手続きが必要になります。 PA-API v5への移行を2019年11月30日までに実施しなかった場合、現在のPA-APIはご利用をいただけなくなります。

これは対応必須ですね。
ということで調査開始。


ドキュメントがあるので、それを参考にしながら、とりあえず新APIを使ってみる。

  • 新しいアクセスキーの取得
  • PA-API v5 の動作確認
    • PA-API v5 Scratchpad (jp) で動作確認 (Web上で)
    • Using SDKのページから PHP 版の SDK 一式をDLして動かす
      • いくつか問題が。例えば、GetBrowseNodes.php が動かない。パスの一部が大文字になっているのを直すと動く。あと、ANCESTOR は取れるけど、 CHILDREN が取れない。などなど。ソースコード見ると作業途中の模様。
    • Scratchpad の Code snippets で良さそう。PHP の Code snippets をコピーして少しいじって使えば十分かと。
    • ということで、サーバでの動作確認ができた

旧APIできていたことが新APIでもできる、ということが、ざっくりレベルですが、確認できました(私が使っている機能・要素に関してのみ)。
私が運営している関連サービスでの旧APIから新APIへの置き換え作業は、この秋、少しずつ進めていきたいと思います。
新APIで新しいこともいろいろできそうなので、それも並行して企画・開発していきたいところ。

1 2 3 4 5 6 7 8 9 10 11 12 [ 次へ ]

たつをの ChangeLog
Powered by chalow