Como usar a IA Gemini para resumir vídeos do YouTube

Internacional


Uma pergunta de acompanhamento sobre a pontuação final foi respondida corretamente, mas Gemini obteve o nome do goleador do primeiro touchdown errado: a IA sugeriu que era Johan Dotson. Dotson recebeu um touchdown nos destaques com as pontuações em 0-0, mas foi descartado-um exemplo das nuances que a IA não necessariamente aprende.

Gêmeos identificou com sucesso quando o Kansas City Chiefs recebeu seus primeiros pontos e até incluiu um registro de data e hora ligando direto ao touchdown no clipe do YouTube. Também acertou o nome do artilheiro. Parece que Gêmeos depende fortemente do comentário de clipes de esportes, o que não é surpreendente.

Resuma o conteúdo do vídeo

A imagem pode conter arquivo e página da web

A IA pode escolher detalhes do vídeo – se eles são mencionados no áudio.

Fotografia: David Nield

Em seguida, tentamos colocar Gêmeos contra um Featurette nos bastidores Para o Grand Budapeste Hotel, dirigido por Wes Anderson. O clipe vai até quatro minutos e meio, e Gêmeos devolveu algumas respostas quase instantaneamente: identificou o nome do filme que está sendo discutido e as principais batidas da narrativa do clipe.

No entanto, tudo depende do áudio (ou da transcrição) novamente – não parece haver nenhuma análise do conteúdo do vídeo real. A IA não sabia dizer quem estava as cabeças falantes no vídeo, mesmo que seus nomes fossem exibidos na tela, e não pudesse dizer quem era o diretor (mesmo que isso também tenha sido mencionado na descrição do vídeo).

No lado positivo, Gemini fez um trabalho impressionante ao resumir o áudio do vídeo. Ele identificou corretamente alguns dos desafios de cinema que foram mencionados por toda parte e forneceu timestamps para eles – desde procurar um set para representar o Grand Budapeste, a preenchê -lo com extras.

Resuma entrevistas

A imagem pode conter arquivo de texto e página da web da página

Os Gêmeos podem fornecer registros de data e hora para o vídeo especificado.

Fotografia: David Nield

Finalmente, tentamos o Google Gemini com uma entrevista: Canal 4 no Reino Unido falando com Charlie Brooker e Siena Kelly sobre a última série de Espelho preto (talvez apropriado para um artigo sobre IA). Gêmeos se mostrou muito capaz em escolher os pontos de discussão e adicionar registros de data e hora, embora, é claro, todo o vídeo esteja falando principalmente.

Novamente, porém, não há contexto sobre nada fora do áudio ou da transcrição. Gemini Ai não sabia dizer onde a entrevista ocorreu, ou como os participantes estavam agindo, ou qualquer outra coisa sobre o visual do vídeo – que vale a pena ter em mente se você usar você mesmo.

Para vídeos em que as respostas que você deseja estão no áudio de um vídeo do YouTube e sua transcrição associada, Gemini funciona muito bem em resumir e fornecer respostas precisas (desde que os comentaristas mencionem quando um touchdown é descartado, bem como quando alguém é pontuado). Para qualquer tipo de informação visual, você ainda terá que assistir ao vídeo.



Source link

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *