
Conntour levanta US$ 7 milhões para construir um motor de busca de IA para sistemas de vídeo de segurança
A indústria de tecnologia de vigilância hoje está em evidência, mas não pelos melhores motivos. Com a controvérsia em torno da Imigração e Alfândega dos EUA recebendo críticas por construir novos recursos que permitiriam à polícia pedir aos proprietários de casas imagens de seus bairros, atualmente há um amplo debate sobre segurança, privacidade e quem pode vigiar quem.
Mas a controvérsia não apaga mercados, e a melhoria contínua dos modelos de linguagem-visual apenas deu mais impulso às empresas que estão criando novas maneiras de ajudar as empresas a monitorar o que acontece em suas instalações.
De acordo com Matan Goldner, cofundador e CEO da startup de vigilância por vídeo Conntour, a ética em torno deste tópico é importante o suficiente para que ele diga que sua empresa é bastante exigente sobre quais clientes vender. Isso pode não parecer uma boa estratégia de negócios para uma startup com apenas dois anos, mas Goldner diz que pode se dar ao luxo de fazer isso porque a Conntour já tem vários grandes clientes governamentais e listados publicamente, um dos quais é o Escritório Central de Narcóticos de Cingapura.
“O fato de termos clientes tão grandes nos permite selecioná-los e manter o controle […] Estamos realmente no controle de quem está usando, qual é o caso de uso, e podemos selecionar o que achamos que é moral e, claro, legal. Usamos todo o nosso julgamento e tomamos decisões com base em clientes específicos com os quais estamos dispostos [a trabalhar] porque sabemos como eles irão usar,” disse Goldner ao TechCrunch em uma entrevista exclusiva.
Esse impulso ajudou a Conntour com mais do que ser seletiva. Os investidores notaram: A startup recentemente levantou uma rodada de investimento de $7 milhões da General Catalyst, Y Combinator, SV Angel e Liquid 2 Ventures.
Goldner disse que a rodada foi concluída em 72 horas. “Acho que agendei cerca de 90 reuniões em oito dias, e logo após três dias — começamos na segunda-feira e na quarta à tarde, já havíamos terminado,” disse ele.
Independentemente disso, a Conntour pode estar certa em ser exigente, especialmente dado o quão poderosas as ferramentas de IA neste espaço se tornaram. A própria plataforma de vídeo da empresa usa modelos de IA para permitir que o pessoal de segurança consulte feeds de câmeras usando linguagem natural para encontrar qualquer objeto, pessoa ou situação na filmagem, em tempo real — um mecanismo de busca semelhante ao Google feito especificamente para feeds de vídeo de segurança. Ela também pode monitorar e detectar ameaças sozinha com base em regras predefinidas e gerar alertas automaticamente.
Ao contrário dos sistemas legados que dependem de definições ou parâmetros predefinidos para detectar objetos específicos, padrões de movimento ou comportamentos, a Conntour afirma que seu sistema utiliza modelos de linguagem natural e visual, o que lhe confere um alto grau de flexibilidade e usabilidade. Um usuário pode perguntar: “Encontre instâncias de alguém de tênis passando uma bolsa no saguão,” e o sistema da Conntour rapidamente pesquisará todas as filmagens gravadas ou feeds de vídeo ao vivo para retornar resultados relevantes.

E porque a plataforma incorpora modelos de IA, os usuários podem simplesmente fazer perguntas sobre as filmagens e obter respostas em texto, acompanhadas pelos feeds de vídeo relevantes, além de gerar relatórios de incidentes.
O ponto de venda da empresa, no entanto, é sua escalabilidade. Goldner explicou que a plataforma difere principalmente de outros serviços de busca de vídeo por IA porque é projetada para escalar de forma eficiente para sistemas que compreendem milhares de feeds de câmeras. De fato, ele disse que o sistema da Conntour pode monitorar até 50 feeds de câmeras a partir de uma única GPU de consumidor, como a RTX 4090 da Nvidia.
A empresa faz isso usando múltiplos modelos e sistemas lógicos, e então identificando quais modelos e sistemas o algoritmo deve usar para cada consulta, a fim de requerer a menor quantidade de poder computacional para fornecer aos usuários os melhores resultados.
A Conntour afirma que seu sistema pode ser implantado totalmente nas instalações, completamente na nuvem ou uma mistura de ambos. Ele pode se conectar à maioria dos sistemas de segurança já em uso ou pode servir como uma plataforma de vigilância completa por conta própria.
Mas há um problema de longa data na indústria de vigilância por vídeo: A qualidade da vigilância é tão boa quanto a filmagem capturada. É difícil distinguir detalhes da filmagem de um estacionamento mal iluminado que foi gravada por uma câmera de baixa resolução com uma lente suja, por exemplo.
Goldner diz que a Conntour se resguarda dessa inevitabilidade fornecendo uma pontuação de confiança junto com seus resultados de busca. Se a fonte de um feed de câmera não tiver qualidade suficiente, o sistema retornará resultados com níveis de confiança baixos.
Avançando, Goldner diz que o maior problema técnico a ser resolvido é trazer o nível total de capacidade de LLM para seu sistema enquanto mantém sua eficiência.
“Temos duas coisas que queremos fazer ao mesmo tempo, e elas se contradizem. Por um lado, queremos fornecer total flexibilidade de linguagem natural, estilo LLM, para permitir que você pergunte qualquer coisa. E por outro lado, há a eficiência, então queremos fazer com que use muito poucos recursos, porque novamente, processar [milhares] de feeds é simplesmente insano. Essa contradição é a maior barreira técnica e o maior problema em nosso espaço, e é com o que estamos trabalhando muito, muito duro para resolver.”
A Conntour representa um avanço na aplicação de IA em segurança, permitindo buscas mais eficientes em vídeos. Isso pode impactar empresas brasileiras que buscam modernizar seus sistemas de vigilância e melhorar a segurança com tecnologia de ponta.

