ゆるりと立派な大人になるために

元組み込みソフトウェアエンジニア、あれこれを書いていこうと思います。TOEICは915点。

Cloud vision apiを使ってみた。 part4 ~LOGO_DETECTION~

 

cloud vision apiを使ってみた。

 

今回で最後にします。

 

LOGO_DETECTION

文字通り、logoを検知するapi

 

画像①

f:id:simplestreet:20151224230226j:plain

 

    "logoAnnotations": [
        {
          "mid": "/m/01jtml",
          "description": "Adidas",
          "score": 0.65040034,
          "boundingPoly": {    

 Adidas。検知できてます。

 

 

 画像② マックダーーーナー。

f:id:simplestreet:20090722145052j:plain

 
"responses": [
    {}
  ]
}

 何もなし。

 

画像③

f:id:simplestreet:20151224230232p:plain

      "logoAnnotations": [
        {
          "mid": "/m/0lwkh",
          "description": "Nike",
          "score": 0.58140534,
          "boundingPoly": {

 Nike が返ってきてます。

 

 

いろいろと画像を試しましたが、文字が入ってるものは検知できました。

なので、ほぼTEXT_DETECTIONと変わりませんね。

 

Image Sentiment Analysis

Vision API can analyze emotional facial attributes of people in your images, like joy, sorrow and anger. Combine this with object detection and product logo detection, so you can assess how people feel about your logo.

 超訳)

 Vision APIは顔の表情から感情を解析します。object detection や logo detectionと合わせて、人々があなたのlogoをどのように感じているかわかります。

 

と、言っておりますが、

人がLOGOの付いたTシャツ着て、走ってる写真も試しましたが、

どれもうまく検知してくれませんでした。

LOGO_DETECTIONとはいうものの、TEXT_DETECTIONの域は越えられていないような気がします。

 

 

 

まとめ

いろんなDETECTIONを試しましたが、結局まともに利用できるのは

LABEL_DETECTIONだけかなっていう感じです。ただそのLABELでさえも、

想像の範囲内っていうか、”なんでこんなに検知できるんだーー”って感じる物ではありませんでした。

 

なんかオープンソースをささっと集めて来て、web apiとして使えるようにしただけって感じです。

 

スマホで利用している音声認識くらいの精度を期待していただけに、残念な結果になりました。

 

まぁ簡単にできるので、興味のある方は

 Cloud vision apiを使ってみた。 part1 に貼ってあるphpのプログラムで試してみてください。