先日、「川柳の面白さを機械は認識できるか?」で弊社の取締役の論文発表についてお知らせしました。個人的に興味深かったのは、川柳を評価する個別の指標8つと総合的な評価が設定されていた点です。
研究に使った機械学習では、「個別評価を学習」するのと「個別評価から総合評価を出すアルゴリズムを学習」するのを別々に行ってこれを組み合わせても、「個別の評価抜きに総合評価を学習」しても、評価の精度(人間の評価との一致度)はあまり変わらなかったようです。
人間の場合はどうでしょうか? 川柳のように現代の日本語ができる人なら比較的容易に理解できるものではわかりにくいと思いますが、日常的に自分が経験していないものを鑑賞・評価するためには細部を捉えて全体の認識に統合する訓練が必要です。その訓練のわかりやすい例を実体験したことがあるので、それについて書いてみます。
以前、熱帯の植物の同定をしていたことがあります。花や実のない葉だけついている枝しかないこともしばしばでした。それでも、科や属くらいまでは、科や属の特徴を覚えることと、「似ている」という感覚でなんとかなります。
ところが、種レベルになると、種まで同定されている標本と見比べて、それと同じか違うかを判断しなくてはならなくなります。言葉でいうと簡単ですが、人間が子どもから大人へ成長するし、一人一人が個性的な顔つき・体つきをしているのと同じで、同じ種の植物なら完全に同じ姿をしているわけではありません。同種の中の変化や変異、別種との違いを見極める目が必要です。これが難しい。
特定の部分を細かく見ていると、どの標本も違うように見えてしまう。全体を見ようとすると、細かい部分が見えなくなってどの標本も同じに見えてしまう。これでは種が同定できません!
私の経験では、一つの属を3回くらい見直すと、種の変異の範囲がわかるようになるし、目も慣れてきます。細部を観察することと、全体を総合的に見ることが同時できる感覚です。ちなみに植物の細部の観察は、たとえばこんな感じです(これは果実つきですが)。
twig hairy; leaves alternate, regularly spaced along twig; lamina to 17 * 5 cm, narrowly elliptic-oblong, acute gradually narrowed to apex, cuneate, only slightly asymmetric at base, shallowly dentate, chartaceous, glaucous below, very sparsely hairy above, hairy on nerves below, scabrid on both sides, 3-nerved at base, many prominent laterals from the outer two, lateral nerves from the midrib 2-3 on each side, tertiary nerves perpendicular to midrib, and forth nerves perpendicular to tertiary nerves, nerves brown below, petiole ca. 1 cm, hairy; inflorescence axillary, with (1-) 2 heads, heads stalked 3-6 mm, branched from the base, head in fruiting to 6 mm diam, globose.
機械学習の学習の仕方と人間の学習の仕方は、同じ部分も違う部分もあると思います。お互いに参考にして、能力を高めていけるといいですね。