这几天科技圈聊得挺热乎,Spotify这流媒体巨头又在搞事情,据说在自家测试环境里弄了个叫Page Match的新功能。大家都在琢磨这背后的玄机。说白了,这就是要把音频跟读书给串起来。现在年轻人哪儿还老老实实地捧着书看?更想一边走路一边听。Spotify也是看到了这个痛点,打算把手伸得更长一点。 功能其实不难理解。你要是在看纸质书或者电子书,直接用手机摄像头扫一下当前页,应用里头的OCR系统就自动干活了。它先把页面内容提取出来分析一遍,然后去后台庞大的有声书库里搜一搜,立马就能定位到对应的音频段落。这下好了,“看图”变成了“听书”,这种转换就像换台那么快。 这设计还挺贴心的,是双向通的。你不只是能从书跳转到音频听,要是听着听着想翻翻原文也没问题。系统会告诉你音频当前进度对应哪一页书,省去了你来回翻找的麻烦。那些搞研究的或者爱读书的人肯定喜欢这种灵活切换的模式。 技术上这套东西也是集合了好几种大招。高精度的文字识别技术得把复杂的排版都认出来;强大的自然语言处理能力得把海量文本跟音频时间戳精准对应上;最后还有那顺滑的界面设计,把所有复杂操作都藏在“扫一扫”这个简单动作背后。 不过话说回来,要想真的用得爽,前提是得先有对应的音频资源。如果没订阅或者没买这个书的有声版,那肯定还是不行。而且拍照的时候光线好不好、书排得乱不乱也会影响效果。 现在的年轻人读书听歌都爱多点花样,以前那种死读或者死守着一个耳机的日子早就过去了。Spotify想把自己的优势拿出来盖到更多地方去。这不仅仅是为了让用户多用他们家平台,更是想把出版业和音频行业这两家给撮合在一起。 业内人士说,“视听融合”这种模式比单纯换个界面要高级多了。它意味着以后我们获取知识的方式会变得立体起来。一本书的内涵不光是静态的文字和图片了,还能连上专家解读、背景音效、多语言版本,甚至还能跟读者社群互动。这对提高全民阅读量、推动文化普及都有好处。 科技一直是推动社会变化的动力源。Spotify搞的Page Match功能算是流媒体向多模态、场景化深度进军的一个缩影。它是在回应年轻一代想要那种灵活、沉浸式的无缝体验的需求。 虽然现在还在测试阶段,具体以后会发展成什么样还不好说。但有一点很清楚:未来的阅读肯定会越来越模糊媒介的界限。大家要怎么抓住机会把内容做得更好、体验做得更优?这就是所有相关行业都得面对的长期课题了。