您当前的位置:科技时空网业界正文

手机扫一扫实际物体隔空复制粘贴进电脑北大校友的AI新研讨

2020-05-11 15:24:18  阅读:1576 来源:腾讯科技作者:责任编辑NO。杜一帆0322

十三 白交 发自 凹非寺

量子位 报导 | 大众号 QbitAI

魔法变实际,酷炫又有用。

还记得两年前,Zach King(男巫)的爆红戏法吗?

不仅从纸直接蹦出一个手机,还直接扔进了电脑里构成虚拟的天猫页面。

现在,不用去仰慕男巫了,人人都能够把身边的东西“扔到”电脑里,并且一部手机就能搞定!

这便是来自34岁法国规划师Cyril Diagne的最新AR黑科技——AR Cut & Paste,将身边的事物“一键”仿制张贴到电脑上,整个完结时刻不到10s。

比Ctrl+C和Ctrl+V还要直爽!

比方,拿手机扫一扫书上的模型图片,再把手机对准电脑屏幕,模型瞬间就仿制到了电脑。

书上的人物也不在话下。

就有网友说道:连这个黑发小哥的头发都能辨认出来,太奇特了。

当然,手写的笔记,也能够仿制张贴到电脑中。

他在Github上共享了他的AR新技能,现已狂揽7K颗小星星;并且在Reddit上共享不到14小时,就获得了近4K的点赞量。

即便Cyril表明现在仅仅能在Photoshop中完结,但未来——必定会有更多不同的输出办法。

仅仅现在,这项AR黑科技——魔法相同的新技能,只需你想,也能复刻。

简略四步,敞开“仿制张贴”新世界

小哥非常热心地在GitHub中,描绘了AR Cut & Paste的“上手攻略”。

首先要着重的是,这是一个研讨原型,而不是针对顾客或许Photoshop用户的东西。

AR Cut & Paste原型包括3个独立的模块。

移动运用 (The mobile app)

能够检查GitHub中/app文件夹,了解怎样将App布置到手机中。

本地服务器 (The local server)

手机APP与Photoshop的接口。

运用屏幕点(screenpoint)找到摄像机在屏幕上指向的方位。

可检查/server文件夹,了解关于本地服务器的装备阐明。

方针检测 / 布景移除服务 (The object detection / background removal service)

现在,显着性检测和布景移除,是托付给一个外部服务来完结。

假如直接在移动运用中运用相似DeepLap这样的技能会简略许多。但这还没有在这个repo中完结。

第一步:装备Photoshop

在Photoshop软件首选项 (Preferences)中,找到增效东西 (Plug-ins)。

点击启用长途衔接 (Remote Connection),并设置暗码。

这儿需求保证一点,PS文档中的设置要与server/src/ps.py中的设置共同,不然只会张贴一个空层。

此外,文档需求一些布景,假如仅仅白色布景,SIFT或许没有满足才能来做一个正确的匹配。

第二步:设置外部显着性方针检测服务

如上所述,现在,有必要运用BASNet-HTTP封装器(需求CUDA GPU)作为外部HTTP服务,布置BASNet模型。

将需求布置的服务URL来装备本地服务器。假如在本地服务的同一台核算机上运转BASNet,请保证装备不同的端口。

第三步:装备并运转本地服务器

这一步的具体文档,在GitHub项目中的/server文件夹中,包括“装置”和“运转”两个过程。

装置代码如下:

virtualenv -p python3.7 venvsource venv/bin/activate pip install -r requirements.txt

运转代码如下:

python src/main.py —basnet_service_ip=”http://X.X.X.X“ —basnet_service_host=”basnet-http.default.example.com” —photoshop_password 123456

其间,BASNET_SERVICE_HOST是可选的,只要在运用Knative / Cloud Run等进口网关在渠道上布置服务时才需求。

以及,用Photoshop长途衔接暗码替换123456。

第四步:装备并运转移动App

装置代码如下:

npm install

然后更新component/Server.tsx中的IP地址,使其指向运转本地服务器的核算机IP:

3: const URL = “http://192.168.1.29:8080“;

运转代码如下:

npm start

OK!敞开“仿制张贴”新世界,便是这么简略!

但假如你期望“知其然更知其所以然”,别眨眼,接着往下看。

怎样做到隔空「仿制张贴」?

这个奇特的AR黑科技背面的首要技能,刚开始选用的是一个叫做BASNet的显着方针检测的新办法。

这篇研讨入围了CVPR 2019,并且论文一作仍是位华人小哥哥——秦雪彬,现已于本年2月在加拿大阿尔伯塔大学拿到了博士学位,硕士就读于北京大学。

BASNet的中心结构如下图所示,首要由2个模块组成:

第一个模块是猜测模块,这是一个相似于U-Net的密布监督的Encoder-Decoder网络,首要功能是从输入图画中学习猜测saliency map。

第二个模块是多标准残差细化模块(RRM),首要功能是经过学习残差来细化猜测模块得到的Saliency map,与groun-truth之间的残差,然后细化出猜测模块的Saliency map。

而最近,这位规划师小哥哥在此基础上,针对布景移除使命,选用了更新的办法。

同样是来自秦雪彬团队,被Pattern Recognition 2020接纳,这个办法叫做U2-Net,其结构如下图所示:

还与其它20个SOTA办法别离做了定量和定性比较试验,在作用上都取得了不错的作用。

鄙人面的定性试验中,也能够比较显着的看到,该办法所提取出来的方针,愈加细粒度和准确。

那么,北大校友的新办法,又是怎样被法国规划师Cyril Diagne搞成黑科技运用的?

不想当程序员的规划师,不是一个好艺术家

原因无他,Cyril Diagne便是这样一个懂程序、搞规划,重视前沿研讨进展的艺术家呀。

假如你重视他的交际动态,也都是天马行空的。

是那种从“诗词歌赋”到“人生哲学”,从“服装规划”到AR黑科技的妙人。

Cyril Diagne,现居法国巴黎,除了规划师,程序员,仍是洛桑艺术州立大学(ECAL)媒体于交互规划系的教授及主管。

2008年从巴黎Les Gobelins校园结业今后,跟5位同学创立了艺术组织,致力于完结科技与艺术之间的构思交互,也奠定了他今后的艺术生计,注定与科技密不可分。

2015年起,Cyril加入了谷歌文明驻巴黎的试验室。

与此同时,他还不断的在Gitbub上共享他的新作用。此前,他就曾在Github上发布了一些有用的小东西。

比方,一个可在Instagram页面的相片上增加3D作用的chrome扩展程序。

在Web浏览器上直接用AR涂鸦你的脸。

输入图画转3D相片。

总归,主意多、阅历丰厚,还懂技能和审美……

所以现在搞出AR仿制这样的美妙运用,翻开一扇新大门,也让一众网友服服气气。

也算是把北大校友小哥的牛X研讨,推到了更牛X的产品运用进口。

尽管还仅仅初露锋芒,但远景却妥妥无限或许。

你觉得这项黑科技,还能怎样用?怎样玩?

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!