Newsletter

Mantenha-se informado sobre as nossas novidades com nosso newsletter semanal, todas as segundas-feiras

O Deckard que me perdoe, mas o futuro chegou.

Nos comentários deste post onde falo sobre o Photosynth da Microsoft estar disponível para usuários comuns o leitor Leandro Lopes comenta que acabou de ver um episódio de CSI onde aparece o Photosynth. Como ontem em um chat com alguns cientistas da Microsoft Research eu comentei que seria algo que eventualmente usariam em seriados como CSI, só posso concluir duas coisas:

1 - A Microsoft roubou minha idéia
2 - A Microsoft tem um DeLorean

O impressionante, impressionante mesmo da cena é que quando Ridley Scott lançou Blade Runner, em 1982 todo mundo achou o máximo o deep zoom que Harrison Ford deu na foto da replicante, mas sempre achou que era ficção científica.

Hoje temos algo MUITO mais poderoso (O deep zoom é só um recurso do Photosynth)e tão assustadoramente legal que é usado em um seriado de TV notório por mostrar exageros computacionais, e não foi mexida uma palha no software.

O Photosynth de CSI é o mesmo que você pode usar para fazer um modelo/mosaico3D/whatever do que quiser.

Aqui, a tal cena, que segundo o Leandro é episódio 18, 4a temporada, e foi criada depois que o pessoal da produção visitou a Microsoft Research e foi apresentado à tecnologia.

Aliás, ainda bem que foi CSI, terrível se fosse parar em Bones.

Não sei quanto a vocês mas eu estou adorando viver no futuro.

0

Agora só falta o Photosynth aceitar vídeos, pegar o controle do Wii escondê-lo em uma luva e adaptá-lo ao PC, e voilá, temos o programa usado pelo Tom Cruise no Minority Report!

Quem chuta quanto tempo a Microsoft vai demorar pra implementar suporte a vídeo? Se já não o estiverem fazendo, né...

Obs: Também adoro o futuro! =P

Carlos Cardoso's picture

Eu perguntei mas estávamos com problema de conexão, então acabei não vendo se responderam. Isso com vídeo vai ser assustador.

Idealmente SEM o Tom Cruise.

tomboderider's picture

Quote:
Idealmente SEM o Tom Cruise.
PLEASE!
http://www.g1.com.br/tecnologia

Huahuahua também prefiro sem ele...

Rhob's picture

Idealmente SEM o Tom Cruise.

E com deep zoom na Luciana Vendramini!! }:)

__________________________________________________________
>> www.nvmania.com.br <<

"No paraíso muçulmano, um orgasmo dura seiscentos anos."
E vc pensando no porco e suas 6 horas de orgasmo... :P

Salsinha's picture

Hoje pela manhã assisti a uma palestra de um francês que consegue encontrar trechos similares em diferentes vídeos, mesmo sendo feitos de diferentes ângulos. Se duas pessoas fizeram a mesma gravação de uma pessoa (diferentes resoluções, ângulos e fps), ele consegue mostrar quais os trechos são cópia e o que (ou quem) é igual. O processamento é em tempo real!

Juntando as duas técnicas seria uma coisa espetacular (ou assustadora).

tomboderider's picture

felipels wrote:
Agora só falta o Photosynth aceitar vídeos, [...]
Bem, ainda não é o photosynth para vídeos, mas estes caras usaram a engine do photosynth para melhorar vídeos.

http://br.youtube.com/watch?v=1PktKqyRXIE

Já é um começo.

ps: vai ter um plugin pra iutubiu nos comentários?

http://www.g1.com.br/tecnologia

Salsinha's picture

Não conhecia o GradientShop. Muito legal o vídeo (e a biblioteca).

PS: interessante o comentário do cara que baixou os fontes e não sabe como executar o programa. Será que ele tem noção de como programar em C++? ;)

criscmaia's picture

Pô Cardoso! Sem legenda? }:)

Estou sem áudio. :(
____________________
naotenho.blog.com.br

Diz ai, Cardoso: seis dezenas aleatórias, entre 01 e 60...

Gabriel_Fa's picture

*Imaginando como isso pode parar em lost*

"Nobody asked me but here's my advice
To a young man or woman who's living this life
In a world gone to hell where nobody's safe
Do not go quietly unto your grave"

Não entendi o espanto de vocês. Fazem dois meses que eu escrevi algo muito parecido para os engenheiros do google. Isto me parece espionagem industrial.

A engine da coisa toda é o algoritmo do Google Earth (colar fotos lado a lado), mas praticado com vídeos. Coloque isto em quatro ou mais projetores holográficos (já existe e até o cinema holográfico) e voilá, aí estão as primeiras imagens 3D sólidas. Coloque magnetos em uma "luva wireless"
e sensores na sala para captar a posição e ações dos magnetos e voilá= interação humana sobre projeções holográficas 3D sólidas reais!

Era uma vez monitor, mouse e teclado, de uma só vez!

______________________
A internet aceita tudo, mas, até por isto, nem tudo é aceitável.

Provérbio bíblico: "Até um imbecil, quando fica de boca fechada, passa por sábio".

Salsinha's picture

Não entendi. Você escreveu (implementou ou publicou) algo assim?

Desculpe, quem não entendeu sua pergunta fui eu.

Eu usava o Google Earth, tive uma idéia para usar o processo como um monitor 3D, juntei todas as peças do quebra-cabeça, escrevi para o departamento de desenvolvimento do google e entreguei tudo de graça. As tecnologias já existem e são patenteadas. Alguém tem que conseguir juntar tudo isto para podermos usufruir do equipamento.
Você queria que eu gardasse a idéia?

______________________
A internet aceita tudo, mas, até por isto, nem tudo é aceitável.

Provérbio bíblico: "Até um imbecil, quando fica de boca fechada, passa por sábio".

Salsinha's picture

Não. Foi ótimo você ter escrito a idéia. Assim alguém pôde "roubá-la" e implementar antes deles. Pelo menos já podemos usufruir disso.

guilherme.atencio's picture

Quote:
Aliás, ainda bem que foi CSI, terrível se fosse parar em Bones.

Ah, Bones não é tão ruim assim...e tem a Emily Deschanel!

Carlos Cardoso's picture

É o único motivo de eu assistir Bones. Sou doidinho por ela.

garoa's picture

Estamos vivendo o futuro já há vários anos, com computação distribuída por trás de todas as inovações tecnológicas modernas, dinheiro digital e comunicação instantânea.

Só não temos ainda carros voadores e replicantes... :P

Que CSI é esse... NY!?

É um saco não ter "parabólica"! Não tenho mais saco pra baixar séries pela NET...

garoa's picture

Que tal comprar os box?

Myhro's picture

É o NY sim, lembrando que a 4ª temporada do mesmo foi a 2007/2008.
Se fosse do CSI (Las Vegas, o original) seria a 2003/2004.

Danskk's picture

Adoro ficção futurista desde que me conheço por gente.
Blade Runner foi um dos melhores filmes que assisti nessa linha!
A cena do personagem Roy Batty(Rutger Hauer) com a pomba branca foi memorável.
Daqui para a frente veremos muito mais coisas do tipo Photosynth nas películas.

Poxa , desculpa não ter respondido no outro post povo , é que eu normalmente não escrevo nada , só leio tudo, daí que não tenho o costume de retornar a um tópico , ou comentarios...

De qualquer modo quem quiser ver o video do pessoal da MS comentando o caso o link é(mas ,já aviso que é em inglês e nao tem legendas):
http://on10.net/blogs/nic/ShutterSpeed-Episode-02/

e o blog de live photo & video da MS é:
http://blogs.msdn.com/pix/

O CSI é o NY ,
Pra quem assistiu... Ri muito ainda na cena aonde o detetive mostrando as fotos pro suspeito vira e fala:
- hey It's a Microsoft's World...I'am just living in it.
hauauahah

magno's picture

Eu vi esse episódio e achei super-maneiro. Fiquei até pensando: legal se alguém implementasse algo assim.

Acho que com um pouco de trabalho em cima dá para criar um ambiente 3D baseando-se exclusivamente em fotos.

Salsinha's picture

Image-Based Modeling?

Salsinha, não entendi. E o google está tão longe. Você pode explicar um pouco o que significam estas palavras?

______________________
A internet aceita tudo, mas, até por isto, nem tudo é aceitável.

Provérbio bíblico: "Até um imbecil, quando fica de boca fechada, passa por sábio".

Salsinha's picture

É uma técnica para criar modelos 3D a partir de fotos. Veja por exemplo o trabalho de Quan. É uma técnica razoavelmente nova que acho muito interessante e promissora.

Outra área que também pode te interessar (relacionada ao assunto que vocês estão discutindo abaixo) é IBR (Image-Based Rendering) que é bem mais popular. É uma técnica na qual as imagens são criadas (renderizadas) a partir de imagens e não de modelos 3D.

A partir de duas ou mais imagens é possível visualizar a cena de outros ângulos (diferentes das fotos originais).

Existem na verdade várias formas de realizar essa tarefa: desde trabalhos que não utilizam geometria (como aquele trabalho do Alex Rav-Acha que o Cardoso apresentou), trabalhos que utilizam geometria implícita (a geometria é só para fazer o morph dos objetos) até aqueles que utilizam geometria explícita (o que o magno disse aí em cima).

Conheço várias pessoas que trabalham nesta área. Aquele efeito do Matrix que parece que fica tudo parado e a câmera fica girando em volta do ator (e que até duplas sertanejas estavam usando) foi feito por pessoas da área. O principal responsável foi um aluno de doutorado da universidade da Califórnia.

Como o magno comentou abaixo, existem vários problemas como por exemplo oclusão. Uma técnica para preencher os espaços vazios (ou errados) é chamado de Inpainting, onde o espaço é preenchido com algo que mantenha a característica da imagem.

Magno, o que o Google Earth faz já é converter 2D em 3D.

Os satélites tiram uma foto ao lado da outra até cobrir toda a superfície terrestre em "tantas horas". O algoritmo do google cola todas as fotos lado a lado e tranforma em 3D. Mas ainda é um 3D falso. Dá profundidade, mas não se pode ver os objetos em (PI * 360º) (Atrás ou embaixo dos prédios. Por isto eu sugeri ao desenvolvimento do google que com quatro ou mais projetores (quantos mais, melhor a definição) pode-se alcançar todos os ângulos da imagem, fazendo um 3D real.

______________________
A internet aceita tudo, mas, até por isto, nem tudo é aceitável.

Provérbio bíblico: "Até um imbecil, quando fica de boca fechada, passa por sábio".

magno's picture

Quote:
o que o Google Earth faz já é converter 2D em 3D.

Nos porões secretos do Illuminati isso é conhecido por "textura". Aplicar uma imagem de certo tamanho a uma superfície em um ambiente tridimensional. O Google Earth faz isso

Quote:
Por isto eu sugeri ao desenvolvimento do google que com quatro ou mais projetores (quantos mais, melhor a definição) pode-se alcançar todos os ângulos da imagem, fazendo um 3D real.

Agora sim você chegou perto do que eu estou falando. O problema da sua idéia é que, mesmo tirando a foto de X ângulos diferentes, não há como auferir a altura de um prédio, por exemplo. E ainda teria que tirar uma foto local, para pegar as paredes do prédio que estão na região de sombra (outro prédio na frente). Sem falar que a hora em que a foto seria tirada deverá ser a mesma para todos os satélites. Bastam algumas horas de diferença pra dificultar a montagem e há de se saber a posição EXATA de cada foto no espaço. Como há muitos pontos cegos, não dá para reproduzir o prédio sem "chutar" o que há na região de sombra. Um exemplo:

http://www.nasa.gov/multimedia/imagegallery/image_...

--

Com a técnica mostrada pelo Photosynth, é possível fazer montagens em 3D por conta da análise de similaridades. Vai haver pontos cegos e lugares iluminados diferentemente, mas o algoritmo parece levar isso em conta. Tira-se a foto de um canto e têm-se 3 paredes.

Magno, tudo o que você falou é verdade, mas eu estou pensando em uma nova tecnologia que mude a forma como as coisas são feitas. Foi assim com a invensão do som estéreo, do "surround", das caixas 2.1, 5.1, 7.1, etc. Foi assim com a tv colorida, foi assim com a HD, foi assim com as múltiplas câmeras nos estádios. Isto é, você vai produzir o sinal com todos os ângulos, com múltiplos canais de captura, etc.

Em se tratando do software deste tópico, ele procura os pontos semelhantes entre todas as fotos disponíveis e vai completando o quebra-cabeças. O mesmo foi feito com os múltiplos ângulos de filmegem do Matrix e outros filmes. Se você tem, no total de tomadas de filmagem, 360º de todos os objetos de um ambiente, você pode "caminhar" no ambiente (navegar) em todas as direções. Se não tiver algum dos objetos o programa vai tentar criar um complemento, mas se a lacuna for muito grande, vai faltar informação para que você "navegue" por aquele lado.

O que eu estou falando é criar áudio e vídeo capturados em 3D. Assim como você pode dar uma mascarada e exibir uma imagem comum numa TV HD, você pode usar software para preencher as lacunas das imagens. Mas se você tiver algumas poucas filmagens de um mesmo lugar isto vai preenxer 360º de todos os lados, lugares e objetos do ambiente com muito mais facilidade do que colando fotos. Mas usar uma holografia como monitor 3D é diferente. Exige que você produza o "desktop" como um cubo 3D, pois uma lâmina como a usamos nas telas hoje é uma imagem 2D, (altura X largura), ainda que nos convençam que isto é 3D. Estou falando de mudar a forma como as coisas são feitas e preencher 360° de todos os objetos sempre. Ainda que você olhe uma holografia 3D "de frente", quando (ou se) deslocar-se você terá mais informações que não tinha na posição anterior, assim como tem-se uma informação diferente ao olhar-se uma pessoa de frente e de lado. Com o porém que um desktop de um pc sempre tem toda sua superfície preenxida. Neste caso pode-se incorporar o "active desktop" e os outros ângulos da imagem ficarem com suas "telas" (imagens) expostas (ou não, por uma configuração de segurança).

Realmente a maior usabilidade de holografia 3D seria em filmes, permitindo navegar pelo cenário em outras tomadas de cena além da padrão. Mas não deixa de ser um assombro você poder aumentar e diminuir a holografia com o toque das mãos, alterar e controlar todas as configurações do pc com as mãos tocando nas imagens. Some a isto um comando por voz mais apurado e leitura de telas treinadas para o seu próprio timbre e qualquer desavisado achará que é bruxaria.

______________________
A internet aceita tudo, mas, até por isto, nem tudo é aceitável.

Provérbio bíblico: "Até um imbecil, quando fica de boca fechada, passa por sábio".

Salsinha's picture

Sugiro que dê uma olhada em trabalhos de Visão Robótica. Existem várias técnicas como "Shape from shading" e "Shape from texture" para tratar esses assuntos.

Se pretende trabalhar nesta área, acho que há muito o que ser feito. Apesar de ser uma área bem antiga (do tempo que computador não existia), ainda tem muito o que ser feito.

meirellez's picture

Ah não! Protesto! Aquilo no começo é um Iphone rosa???
Cardoso, você é um tendencioso!!!!

AUHEUHAUEHAUHEUHAUEHUHuehuehuaheuahuehaueh!

Ai ai... eu SI divirto...

---------------------------------------

Só a mudança é permanente.

sricanesh's picture

ehhhhhhh terminei meu primeiro synth!! http://photosynth.net/view.aspx?cid=4696152c-a422-...

406 fotos, 99% de "synth"!

Demorou algumas horas para "compilar" tudo.

Cassio R Eskelsen

Carlos Cardoso's picture

Ficou muito, muito bonito mesmo!

criscmaia's picture

Não sei se estou fazendo alguma coisa muito errada, mas só estou conseguindo ver os pontos, sem as fotos. :?

[EDIT]
Estava acessando pelo firefox. :(
Muito bonito mesmo.
Curiosidade: Quantos mb deu tudo?

____________________
naotenho.blog.com.br

garoa's picture

"Web Browser: Internet Explorer 7, Firefox 2, and Firefox 3"

O problema é o SO.

Mamutti's picture

No site do Photosynth:
"Unfortunately, we're not cool enough to run on your OS yet. We really wish we had a version of Photosynth that worked cross platform, but for now it only runs on Windows.

Trust us, as soon as we have a Mac version ready, it will be up and available on our site."

Have you guys ever heard about Linux? Novell?

Nenhuma novidade...

    iCaju
Carlos Cardoso's picture

Já, em termos estatísticos chama-se "ruído de fundo".

Mamutti's picture

Nenhuma novidade...

    iCaju
Marcio Neves's picture

PQP, só na TV mesmo para conseguirem dar um zoom tão poderoso assim com fotos feitas em celulares :D



Design Wenetus