Qual a Diferença Entre RAW, Log Vídeo e Vídeo Não Comprimido?
A entrada em força do digital na esfera cinematográfica, televisiva e videográfica nos finais da década de 90, do século passado, em ambientes profissionais pouco disponíveis à sua aceitação pacífica, acarretou uma dificuldade acrescida às tentativas de transmissão dos necessários conhecimentos, no sentido de tornar mais suave a implementação dessa tecnologia, ou seja, de se fazer frente a um modo novo de se captar, registar, tratar e visualizar as imagens, assim como sons e demais elementos.
Dada a quase inexistência de cursos credíveis na área do digital, assim como de bibliografia, em língua portuguesa, sobre a mesma, muitos foram os novos termos que entraram no léxico português sem que aos mesmos se associasse o necessário critério de interpretação que permitisse o entendimento correcto do significado dos mesmos.
Tendo como objectivo o esclarecimento de algumas das dúvidas mais frequentes sobre as quais somos frequentemente questionados, vamos dar uma vista de olhos pelos princípios que nos conduziram até aos dias de hoje, sendo essa análise feita na base de não se pretender esgotar o tema, mas, apenas, dar linhas orientadoras que possam levar os interessados no tema à busca de informação mais suculenta após esta primeira abordagem de estímulo para algo que passou a fazer parte da nossa vida comum.
As mais recentes câmaras digitais apresentam a capacidade de captação de registo interno ou externo em formato RAW, Log ou Vídeo Não Comprimido, cabendo à ARRI Alexa a capacidade de a opção pelo formato de registo ser exclusivamente da parte do utilizador, pois a mesma foi concebida para responder às necessidades de qualquer uma das alternativas.
RAW
Podemos definir, em termos genéricos, uma imagem em Formato RAW como sendo aquela que nos é fornecida pelo elemento conversor luz/corrente eléctrica, ou de outro modo, pelo sensor de imagem, antes de a mesma ser submetida, exteriormente, a qualquer tratamento, razão pela qual há quem lhe chame “imagem crua”, “imagem sem processamento” ou “imagem intrínseca”, ou seja, não se aplica, em princípio, qualquer tipo de compressão.
Pode fazer-se uma associação directa com o registo baseado em película, no qual, após a revelação da mesma, se obtém a imagem negativa, carecendo esta do necessário processamento para se alcançarem as tão desejadas imagens finais, cujo conteúdo corresponde, dentro de determinadas normas, às imagens captadas.
Em termos literais, o termo RAW em inglês significa, precisamente, não processado.
À saída do sensor de imagem, considerando não haver internamente qualquer tratamento, obtém-se uma informação do tipo R, G e B, a qual carece do devido manuseamento, como seja, o equilíbrio dos brancos ou de sensibilidade, a partir do qual se obtém, a nível de pixel, a necessária informação cromática global da imagem, o que implica a impossibilidade de visionamento da imagem captada neste formato dado estar-se a trabalhar a nível de fotosite, obtendo-se o valor de cada primária na forma individual, o que torna impossível a visualização em termos cromáticos e de luminância do pixel em análise.
Face ao exposto, a conclusão imediata é a de que, de facto, RAW não é vídeo, o que vai implicar a sua transformação através do chamado “demosaicing”, “de-Bayer” ou “debayering”, resultando deste o necessário sinal de vídeo.
Pode afirmar-se que todas as câmaras digitais numa determinada fase de operação apresenta o sinal captado em Formato RAW, contudo, só algumas câmaras têm a capacidade de fornecer para registo externo o sinal neste formato, como acontece, por exemplo, com a RED, a F65 da Sony e a Arri Alexa, entre outras.
As principais desvantagens do registo em Formato RAW residem na grande quantidade de informação disponibilizada, a qual irá reduzir a capacidade temporal de utilização do dispositivo ou equipamento de gravação, assim como o consumo de tempo na transferência de registos RAW para os sistemas de pós-produção, razão que levou ao desenvolvimento de ferramentas vocacionadas para que tal seja menos doloroso.
Log Vídeo
A visão humana corresponde, no seu todo, a uma máquina altamente sofisticada, a qual, desde tempos remotos, tem sido imitada pelo homem nos vários dispositivos de captação e registo de imagem, tanto nas máquinas fotográficas, nas suas múltiplas facetas, passado pelas cinematográficas e videográficas, e, agora, com o advento do digital nas ultra-modernas câmaras, cujas dimensões e qualidade se começam a aproximar do olho comum.
Acontece que o olho humano ao ser banhado pela luz reflectida pelos objectos tem um comportamento diferente dos dispositivos electrónicos transdutores da luz em corrente eléctrica, ou seja, a sua resposta não é linear, ou, o mesmo é dizer, se perante determinada quantidade de luz se obtém corrente eléctrica proporcional a essa luz, ao duplicar-se o seu valor não haverá um aumento para o dobro mas de apenas um quarto.
Dizendo de outro modo, a relação luz/corrente eléctrica no olho humano segue uma lei de não linearidade, ou seja, traduzindo em termos matemáticos, a relação é do tipo logarítmico, o que faz com que se tenha que se entrar em consideração com tal facto quando se captam imagens com dispositivos electrónicos.
As modernas câmaras digitais recorrem, na sua totalidade, ao registo em Formato Log, havendo, fundamentalmente, quatro tipos distintos como o S-Log, da Sony, o Log-C da ARRI, o RED Film Log da RED e o C-Log da Canon, cada um aplicável a câmaras específicas, contudo, com resultado final idêntico.
Sempre que se activa o modo Log a imagem fica plana e dessaturada, contudo com a característica de poder ser visionável num monitor de vídeo, dado que não se está a trabalhar em Formato RAW mas sim em vídeo, maximizando-se a gama tonal do elemento transdutor (sensor), recorrendo-se a uma transformada de dados, conhecida em gíria por LUT (Look Up Table – Tabela de Aspecto) a qual torna a imagem vídeo mais de acordo com o aspecto que a imagem se nos apresenta em condições normais (Rec. 709).
Vídeo Não Comprimido
Pelo facto de se ter afirmado anteriormente de que o Formato RAW implicar, em princípio, a inexistência de qualquer tipo de compressão, ao falar-se em Formato Vídeo Não Comprimido, tal não significa dizer que se está perante um Formato RAW.
Aqui chegados surge a pergunta que se impõe, ou seja:
“Então, o que é isso do Vídeo Não Comprimido?”
O sinal de vídeo, propriamento dito, é obtido a partir dos dados RAW quer se trate de uma câmara que recorre a três sensores CCD ou C-MOS, os quais se encontram a jusante do sistema separador cromático baseado numa combinação dicróica, ou, em alternativa, de um único sensor do tipo “Bayer Pattern”.
Enquanto os dados em Formato RAW recorrem de 12 a 16 bits por palavra, o vídeo é mais modesto sendo norma o recurso a 8 ou 10 bits, obtendo-se 256 ou 1 024 níveis de quantificação/codificação para o último caso, em alternativa aos 4 096 ou 65 536 no primeiro.
Quando nos referimos a vídeo na forma R,G,B, ou de outro modo a 4:4:4, o que pretendemos dizer é que em cada pixel há informação no que respeita não só à crominância que este apresenta mas também à que corresponde à luminância, sendo a opção 4:4:4, apesar de tudo, um modo disfarçado de compressão, tendo em consideração o princípio da amostragem Shannon/Nyquist.
Em sistemas menos exigentes em termos de qualidade objectiva ou subjectiva, pode ainda optar-se, antes do registo propriamente dito, pelas combinações 4:2:2, 4:2:0 ou 4:1:1, ou caso se queira subir a parada a amostragem passa a 4:4:4:4, sendo o último 4 referido ao sinal key, ou, então, a 8:8:8:8 e ainda a 16:16:16:16. A descodificação da metodologia e aplicação deste emaranhado de dígitos será tratado em peça a elaborar, face à dispersão que o seu entendimento iria provocar ao tentar-se, aqui, explicar algo que sem ser um tema do outro mundo requer, porém, uma atenção especial.
A saída de uma câmara digital na forma HD-SDI (High Definition-Serial Digital Interface) é considerada, entre a comunidade profissional, como sendo um sinal não comprimido, contudo ao fazer-se a análise das especificações do mesmo, verifica-se que este apresenta uma resolução de 1920x1080 (2 073 600) pixéis, com palavras de comprimento 10 bits (bit depth) e uma amostragem 4:2:2, ou seja, há algum grau de compressão, apesar de não se ter aplicado uma compressão convencional do tipo espacial ou temporal.