кто хочет узнать как это работает - гуглить "deep learning".
Вот например фреймворк:
http://caffe.berkeleyvision.org/
В примерах как раз обработка имиджей:
http://caffe.berkeleyvision.org/gathered/examples/imagenet.html
Ничего сложного, лупишь на куски и кранчишь.