Cientistas treinam inteligência artificial para sugerir samples de bateria
O algoritmo foi alimentado com mais de 5 mil músicas. Entendendo nossas preferências estéticas, ele aprendeu a recomendar a batida ideal.
“Sample” é uma palavra inglesa que significa “amostra”. Na indústria musical, principalmente na música eletrônica, é comum que artistas peguem amostras, ou samples, de bancos na internet ou até de outras canções. Com bibliotecas praticamente infinitas à disposição, escolher qual é o melhor som para a sua canção pode custar tempo e energia.
Pensando nisso, pesquisadores do Sony Computer Science Laboratories (CSL), na França, aplicaram técnicas de machine learning para ajudar produtores musicais na busca pela bateria ideal para cada música. O algoritmo seria capaz de identificar uma faixa e mostrar samples de bateria que melhor correspondam a ela.
Atualmente, produtores têm apenas algumas ferramentas simples para selecionar as amostras. A principal são os filtros por tags, ou palavras-chave, o que reduz um pouco a carga, mas não o suficiente.
Principal autor do estudo, Stefan Lattner começou a desenvolver o novo sistema há alguns anos, para tentar encontrar amostras de bateria de uma maneira mais intuitiva e eficaz. Contudo, devido às limitações da tecnologia da época, ele teve de ser colocado de lado.
“O sistema que criei anteriormente não era muito elegante, então não o publiquei”, explicou Lattner. “Com as tecnologias recentes, ficou muito mais fácil estimar se dois pontos de dados se encaixam. Como resultado, o sistema se tornou mais geral e meu método pode ser usado para estimar o ajuste de muitos tipos de sons.”
Com o SampleMatch, músicos podem inserir uma faixa em qualquer estágio da produção musical. O sistema classifica automaticamente dentre uma biblioteca de amostras de bateria qual ele julga ser a melhor combinação.
Lattner treinou SampleMatch usando um grande conjunto de dados de 4.830 faixas de música eletrônica e 885 faixas de pop/rock famosas. Especificamente, ele usou pares de áudio de músicas instrumentais (sintetizadores, baixos, guitarras, cordas, teclados e vocais) e faixas de bateria correspondentes.
“O SampleMatch foi treinado com pares de áudio que sabíamos que combinariam”, conta Lattner. “Agora, quando mostramos um novo par ao modelo, ele fornece uma ‘pontuação correspondente’.”
Algumas escolhas de produção musical são estéticas – vão do ouvido e da preferência de cada um. Embora seja óbvio que um instrumento não deva ser tocado fora do tom, não existe teoria que explique o motivo de alguns samples de bateria se encaixarem melhor na sua faixa do que outros. “Ao mostrar exemplos, um computador pode aprender os princípios estéticos que aplicamos quando escutamos. De alguma forma, ele aprende a ouvir como um humano”, afirma Lattner
No futuro, o modelo criado por Lattner e seus colegas da Sony CSL poderia ajudar os produtores musicais a obter as melhores amostras de bateria ou outras amostras instrumentais com mais facilidade e praticidade. Além disso, um estudo da maneira como o sistema aprendeu a organizar os dados pode ajudar a elaborar novas teorias para orientar a produção musical. Entender como o sistema entendeu as faixas permitirá que os pesquisadores esbocem algumas regras gerais para a mixagem de músicas.