sexta-feira, 29 de novembro de 2024

REFLEXÃO: QUAL É A VERDADEIRA PEGADA HÍDRICA DA INTELIGÊNCIA ARTIFICIAL?


                                                                                                                      media.wired.com

A Espanha está a investir fortemente em infra-estruturas digitais e tem atualmente o ritmo mais rápido de expansão de centros de dados na Europa. Uma cidade da área metropolitana de Barcelona, Cerdanyola del Vallés, irá em breve albergar quatro novos centros de dados. Ainda é impossível calcular quantos recursos a infraestrutura de IA precisa para funcionar à escala - incluindo a água, um recurso que a Espanha está a esgotar rapidamente, com 78% da sua massa terrestre ameaçada pela desertificação. Ao optarem pelo crescimento impulsionado pela indústria da IA, será que os urbanistas espanhóis vão pôr em risco a sua água amanhã?

Quando a IA generativa começou a dominar as manchetes após o lançamento do ChatGPT da OpenAI em 2021, surgiram relatórios preocupantes sobre a quantidade de água e energia necessária para treinar um grande modelo linguístico. Agora que a tecnologia está a ser incorporada num número crescente de aplicações de consumo, desde aplicações de fitness à pesquisa do Google, está a tornar-se evidente que o problema não se limita ao processo de criação, mas também à sua utilização diária em massa. Isto deve-se às exigências de recursos dos centros de dados, os armazéns de computadores que processam todos os cliques e percursos que os utilizadores fazem em aplicações baseadas na nuvem, incluindo ferramentas de IA em linha. A computação em nuvem consome pouca energia do dispositivo do utilizador final, não porque a tecnologia tenha evoluído para um ponto em que o processamento é efémero - embora isso pareça ao utilizador final - mas porque o processamento é externalizado para um computador num centro de dados. Estas "quintas de servidores" exigem energia equivalente à da indústria pesada e funcionam ininterruptamente, 24 horas por dia, 7 dias por semana, 365 dias por ano. Dependem também de sistemas de arrefecimento para evitar o sobreaquecimento e o mau funcionamento das filas de servidores, que consomem eletricidade e água.

Há diferentes técnicas para arrefecer um centro de dados e, embora a escolha mais consciente do ponto de vista ambiental dependa da sua localização, a utilização de água ou de energia situa-se geralmente em extremos opostos de uma serra: se a utilização de uma for reduzida, a outra tem de ser aumentada para compensar. Se os operadores utilizarem o arrefecimento evaporativo - em que o ar quente do centro de dados é passado sobre a água e evaporado numa torre de arrefecimento - o consumo de eletricidade cairá a pique, mas são necessárias enormes quantidades de água. Se utilizarem um sistema de circuito fechado - em que a água é arrefecida com ar condicionado e canalizada para arrefecer os servidores, voltando a ser arrefecida novamente - os operadores utilizarão muito menos água, mas uma grande quantidade de eletricidade. A maioria dos centros de dados modernos combina um destes métodos com algum grau de arrefecimento livre que, como o nome sugere, envolve a utilização de ventoinhas para soprar ar fresco do exterior para os servidores. No entanto, exceto em circunstâncias muito raras, este método não é suficiente por si só. Em suma, não há como contornar o facto de os centros de dados consumirem água.

Os centros de dados que suportam aplicações de IA consomem uma quantidade particularmente grande de energia e água para funcionar devido aos seus processadores especializados, unidades de processamento gráfico (GPUs). As previsões climáticas pré-pandémicas da Big Tech não tiveram em conta as necessidades energéticas da utilização desenfreada da IA.

Por exemplo, o ChatGPT necessita de até três garrafas de água para gerar um único e-mail de 100 palavras. Se a procura global de IA mantiver a sua trajetória atual, as melhores estimativas colocam a sua retirada de água em cerca de 4,2 a 6,6 mil milhões de metros cúbicos até 2027; o equivalente ao consumo anual de metade do Reino Unido.

Embora os centros de dados existam desde a década de 1990, as empresas que os operam nunca foram obrigadas por lei a comunicar os números relativos ao consumo de água. Ainda no ano passado, no meio do que os especialistas da ONU rotularam de crise mundial da água, apenas 41% dos operadores de centros de dados comunicaram qualquer métrica de utilização de água. O setor dos centros de dados é notoriamente privado, com intervenientes importantes como a Google a fazerem lóbi publicamente para que esta informação permaneça um segredo comercial. Estas instalações são talvez a derradeira metáfora física da "caixa negra" algorítmica e tornaram-se uma espécie de objeto fetiche para os investigadores das humanidades digitais. Para entrar num deles é geralmente necessário um passaporte ou outra identificação governamental, e são frequentemente ocultos no Google Maps.

Entre o secretismo da indústria e a complexidade de fazer cálculos exatos graças ao nexo água-energia, não há formas fiáveis de estimar a quantidade de água que um centro de dados de IA irá utilizar. Assim sendo, é de esperar que os urbanistas os abordem com cautela, especialmente os que se situam em zonas com escassez de água - das quais Espanha é uma das mais industrializadas do mundo. A primavera de 2024 assistiu à pior seca de que há registo na região nordeste da Catalunha. No auge da crise, o reservatório que abastece a área metropolitana de Barcelona, incluindo Cerdanyola, desceu para 15% da sua capacidade. Foi declarado o estado de emergência e foram adotadas uma série de leis temporárias. As icónicas fontes públicas de Barcelona foram desligadas e foram introduzidos limites diários de água a nível dos cidadãos. O setor agrícola, responsável por um pouco menos de um quinto do PIB da região, foi obrigado a reduzir o seu consumo em 80%, uma medida que deu origem a bloqueios de tratores nas ruas principais de Barcelona.

O futuro da água em Barcelona é precário e poucas das soluções propostas pelos políticos locais são isentas de controvérsia. Falou-se em trazer água fresca de barco de Marselha ou por condutas do Ebro, um rio mais a sul, mas a opção escolhida, ao que parece, foi investir 500 milhões de euros em centrais de dessalinização flutuantes.

O plano de dessalinização foi criticado pelos 30 grupos de campanha envolvidos no debate em torno das questões de gestão da água em Barcelona, que se reúnem na Cimera Social da Água (Cimera Social de l'Aigua). Em nome da Plataforma Defensa de l'Ebre, Matilde Font Ten disse:

‘Estamos a consumir muito mais água do que a que temos disponível. As alterações climáticas estão a reduzir os níveis de precipitação, a diminuir os caudais dos rios e a provocar a subida do nível do mar. Combinados, estes fatores oferecem pouca esperança de um futuro sustentável para a água na Catalunha. Para que os cidadãos possam ter um futuro com menos doenças e melhor saúde, é fundamental usufruir de um ambiente saudável. Esta deveria ser a prioridade de qualquer governo, em vez de colocar as preocupações económicas acima de outros sectores.’

A COP29 apela à recuperação dos aquíferos para aumentar a capacidade de recarga de água da região a longo prazo, bem como a uma informação transparente sobre a quantidade de água utilizada pelos vários segmentos da sociedade, o que poderia servir de base para reduções. O problema com esta sugestão é que, de acordo com a legislação regional, os dados relativos ao consumo de água dos consumidores industriais estão protegidos da publicação devido à sua ligação aos dados fiscais, que são legalmente considerados sensíveis.

A expansão dos centros de dados em Cerdanyola torná-la-á um dos, se não o mais importante centro de dados em Espanha. Os dois maiores serão um centro de dados de 42 megawatts explorado por uma imobiliária norte-americana, a Panattoni, e um de 60 megawatts da AQ Compute, uma filial da empresa de investimento alemã Aquila Capital. Para colocar a sua escala em perspetiva, um único megawatt de energia pode alimentar uma média de 173 casas nos EUA. Até há relativamente pouco tempo, os únicos centros de dados desta dimensão eram os "hiperescaladores", construídos em nome de um gigante da tecnologia como a Google ou a Meta, mas agora estão a ser construídos cada vez mais por empresas menos conhecidas, para as quais os centros de dados são uma atividade secundária lucrativa, em vez de uma oferta principal. Esses centros de dados não têm o mesmo escrutínio público das suas credenciais de sustentabilidade.

Carlos Dapena, responsável pelo projeto do parque industrial de Cerdanyola, o Parc de l'Alba, explica que os centros de dados da cidade serão arrefecidos com "arrefecedores de condensação a ar que evitam o consumo de água potável" e que nenhum dos centros de dados que virão para a cidade pediu autorização para uma quantidade anormal de água para uma atividade no parque industrial.

Mas há precedentes de operadores de centros de dados que subestimam a quantidade de água que os seus serviços irão consumir. No início deste ano, a Meta anunciou planos para construir a sua sede no Sul da Europa na cidade espanhola de Talavera de la Reina - planos que, segundo o governo local, utilizariam "pouca ou nenhuma" água. Quando os pormenores foram divulgados, sob pressão do grupo de activistas Tu Nube Seca Mi Río (A Tua Nuvem Seca o Meu Rio), veio a lume que o projeto consumiria 665,4 milhões de litros de água por ano - apesar dos meros 40,6 milhões que lhe foram atribuídos nos acordos municipais. Não se trata de um incidente isolado; em 2022, descobriu-se que um centro de dados nos Países Baixos consumia mais de quatro vezes a quantidade de água que o seu operador alegava. Quando a Microsoft avaliou a pegada hídrica de um dos seus centros de dados no Texas, descobriu que o verdadeiro custo da água era 11 vezes superior ao que estava a pagar.

De acordo com a imprensa tecnológica e as publicações comerciais do sector, o problema da água nos centros de dados está sempre prestes a ser resolvido, seja com chips mais eficientes ou com o advento da energia de fusão limpa. Houve muito alarido em torno da descoberta de que é agora, tecnicamente, possível arrefecer um centro de dados sem água. No entanto, a viabilidade de gerir centros de dados em grande escala sem recursos hídricos consideráveis é geralmente exagerada. O centro de dados subaquático da Microsoft, por exemplo, um exemplo frequentemente citado dos avanços de arrefecimento da indústria, fechou no início deste ano. O ritmo acelerado de expansão está a ultrapassar de longe a procura de soluções técnicas revolucionárias.

Uma minoria de profissionais do setor dos centros de dados admite-o abertamente. John Booth é um consultor em sustentabilidade de centros de dados e uma voz franca no setor. Embora acredite que o setor tenha melhorado consideravelmente as práticas nos últimos dez anos, Booth ainda vê os centros de dados como longe da questão da sustentabilidade.

Booth é coautor de uma nova Diretiva de Eficiência Energética da UE (EED) que vai forçar os operadores a apresentar relatórios sobre a questão. A legislação, que entrou em vigor em setembro de 2024, exige que os centros de dados europeus comuniquem 14 itens de utilização de recursos, incluindo o seu consumo de água e a quantidade de água proveniente de fontes potáveis. Espera-se que, com o tempo, isto conduza às primeiras referências verdadeiramente representativas da pegada de recursos dos centros de dados.

Sem oposição e sem planos disponíveis para discussão pública, a pegada hídrica dos centros de dados planeados para Cerdanyola parece, à primeira vista, não ser um problema. Afinal, para colher os benefícios económicos do boom da IA, a sua infraestrutura tem de estar localizada algures - e Barcelona, com o seu ecossistema saudável de empresas tecnológicas, parece estar entre os beneficiários. Mas com tão pouca clareza sobre a utilização dos recursos, como podem os planeadores urbanos pesar os potenciais benefícios de tais infra-estruturas em relação ao efeito sobre os recursos hídricos, e muito menos comunicá-los suficientemente para que os cidadãos tenham uma palavra a dizer?

Um primeiro passo seria encomendar mais avaliações independentes dos efeitos dos centros de dados na área que albergam. Com demasiada frequência, os relatórios de impacto são patrocinados pelo próprio setor e as conclusões são tiradas antes da investigação. No caso de Barcelona, foi recentemente publicado um panfleto que explica que, graças a "um círculo virtuoso entre inovação e desenvolvimento económico", os investimentos em centros de dados de 1,04 mil milhões de euros renderão sete vezes mais. O panfleto é da autoria da Digital Realty, uma empresa de centros de dados presente na cidade. O problema não é apenas que as avaliações tendenciosas pesam no ganho económico de uma área sobre questões relacionadas com a sua segurança hídrica; os poucos relatórios não industriais realizados sobre este tópico revelam que não é claro se os centros de dados trazem benefícios financeiros significativos para a sua área de acolhimento. Em 2016, uma análise da Good Jobs First concluiu que os subsídios estatais dos EUA pagam 2 milhões de dólares por cada emprego criado num centro de dados.

Esses relatórios independentes também poderiam ser instrutivos para os operadores de centros de dados. Atualmente, as empresas enfrentam um dilema quando decidem onde construir os seus centros de dados. Se "seguirem o sol" e localizarem os seus armazéns em locais quentes como Cerdanyola, necessitarão de uma quantidade considerável de água para arrefecimento, mas podem aceder a energia solar abundante, o que significa que necessitarão de menos utilização de água de "âmbito 2". Se "não seguirem o sol" e os localizarem em regiões mais frias, utilizarão menos água diretamente, mas com menos acesso a energia solar renovável, provavelmente terão de aumentar o seu consumo de combustíveis fósseis, aumentando a utilização de água de âmbito 2. Isso seria menos intensivo em termos de recursos e, por conseguinte, mais barato e potencialmente mais fácil de gerir através da teia de leis de sustentabilidade da UE. Seria útil dispor de números concretos para responder a esta questão.

Em segundo lugar, se, como parece, os centros de dados representam uma carga considerável para os recursos hídricos do local onde se encontram, seria sensato garantir que não se concentram numa única área, talvez através de um planeamento nacional centralizado. Os centros de dados tendem a multiplicar-se em tamanho, uma vez que há uma vantagem de conetividade em colocar um perto do outro. Isto levou a uma situação em que quatro cidades europeias se tornaram os locais preferidos dos operadores para a construção - Frankfurt, Londres, Amesterdão e Paris. Embora Cerdanyola possa ter a capacidade de recursos para acolher um ou dois centros de dados planeados com cautela, permitir que uma área com problemas de água se transforme num grande centro de centros de dados seria claramente insensato.

No entanto, estas são apenas soluções parciais. Infelizmente, a única solução duradoura para o problema da localização das infra-estruturas que consomem muita água num planeta que está a secar tem de passar pela redução da procura. Isto exigiria uma reavaliação da velocidade e da amplitude da adoção da IA em todas as facetas da vida do consumidor. Com base no que sabemos sobre a pegada hídrica da IA, parece irresponsável que o Google, operador do motor de busca mais utilizado do mundo, tenha integrado a tecnologia em todas as pesquisas por defeito. Até porque os resumos da IA têm mais probabilidades de serem incorretos do que os resultados de pesquisa tradicionais. A IA está a ser implementada em massa, independentemente de ser a ferramenta mais adequada para uma determinada tarefa. Do ponto de vista da utilização de recursos, utilizar o ChatGPT para gerar um e-mail de 100 palavras é como desentupir a casa de banho com uma barra de dinamite. Sim, vai funcionar, mas havia caminhos que poderia ter tentado primeiro e que fariam o trabalho de forma mais fiável - e sem danificar o seu ambiente imediato.

Neste momento, as bacias internas da Catalunha estão a atingir pouco mais de 30% da sua capacidade. No entanto, o futuro da água na região é incerto e é impossível avaliar em que medida os grandes centros de dados de Cerdanyola o afectarão. Numa crise climática, em que qualquer grande consumidor de água deve ser avaliado, é absurdo que os centros de dados não tenham de declarar os seus números. Se essa declaração fosse pública, o imaginário popular da IA como algo que só existe no mundo imaterial do ciberespaço poderia mudar para algo coerente com os seus impactos ambientais. Com essa mudança, pareceria correto reservar a tecnologia para situações que mereçam uma solução com recursos intensivos. Os operadores de centros de dados podem também ter um nível de responsabilidade local proporcional ao seu impacto local. Na ausência de números concretos, só podemos esperar que as definições do operador de "praticamente nenhuma" utilização de água sejam feitas de boa fé.

Miranda Gabbott, Tech Policy Press.


Sem comentários: