En bref: Reddit bloque l’Internet Archive, Anthropic étend le contexte, Cloudera apporte l’IA sur site
Entre deux gros titres, plusieurs actus ont retenu notre attention cette semaine sans faire l’objet d’un article. En voici un aperçu.

Reddit restreint l’accès de l’Internet Archive à son contenu
The Verge rapporte que Reddit va empêcher l’Internet Archive d’indexer la majorité de ses pages. Selon Reddit, des entreprises d’IA ont extrait des données depuis la Wayback Machine. Seule la page d’accueil restera accessible pour archivage.
Claude Sonnet 4 prend en charge jusqu’à un million de tokens
Anthropic annonce que Claude Sonnet 4 peut désormais traiter un million de tokens de contexte, soit cinq fois plus qu’avant. Cette capacité, en bêta publique via l’API Anthropic et Amazon Bedrock, permet l’analyse de vastes bases de code ou de corpus documentaires.
Cloudera propose l’IA privée sur site
Cloudera lance Data Services 1.5.5, offrant des capacités d’IA privée directement dans les centres de données. Cette version inclut l’inférence et le développement GenAI sur site, alliant sécurité, expérience cloud-native et efficacité accrue grâce à une architecture conteneurisée et au découplage du calcul et du stockage.