Pine 发自 凹非寺
量子位 | 公众号 QbitAI
重度互联网爱好者们福利来了!
你是否遇到过这种情况:一个梗图寻遍全网都还没找到。
现在外网一位小哥搞出了一个互联网规模的Meme搜索引擎,库里有近两千万个梗图,涵盖各种小众文化。
检索关键词,或者上传相似图片,结果就能秒出!
若遇到Meme库里没有的梗图,还可共享上传。
网友六年都没找到的梗图,在这个小哥的网站上2分钟就找到了。
然鹅这样一个秒秒钟出梗图的背后的装置确实酱婶儿的:
(这不会有点太简陋了吧)
这时候可能就有盆友好奇,这个粗糙的装置是如何做到快速检索梗图的?
那不妨一起来看看这个“Meme搜索引擎”是如何搭建的~
灵感来自iPhone图片识别
要编写一个Meme搜索引擎,最重要也是最先面临的一个问题就是:如何准确识别梗图中的文字信息?
用专业一点的话来讲就是:如何拥有一个可伸缩的OCR(光学字符识别 )?
OCR的解决方案倒是有现成的,不过现有的要么就是遇到比较抽象的梗图识别效果不太好,要么就是太贵。
举个简单的栗子
,比如说用Tesseract OCR来提取图像中的文字,测试时,只能用非常标准的字体和配色方案识别Meme图,不然的话就会出现下面这种情况。
这是原图:
这是识别出来的文字:
30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmills
emmmmmm
不过灵感很快就来了,小哥偶然间在iPhone给别人发一个验证码图片时。
这是验证码图片:
这是复制过来的文字:
并且iPhone的这个功能已经在iOS Vision框架中公开了,可伸缩OCR的问题这不就有解决办法了嘛~