Google-dochterbedrijf DeepMind presenteerde een nieuwe versie van AlphaGo. Het algoritme speelt het bordspel Go een stuk beter dan zijn voorganger. Dat heeft hij zichzelf aangeleerd.

AlphaGo Zero werd door Deepmind beschreven in een door Nature gepubliceerde studie.

Het nieuwe algoritme werd geprogrammeerd met alleen de basisregels van Go. De rest leerde de computer zichzelf. AlphaGo Zero werd beter door tegen zichzelf te spelen en te leren van zijn fouten en overwinningen.

Na drie dagen kon Zero de vorige versie van AlphaGo verslaan met honderd overwinningen tegen nul. Twee jaar geleden wist de originele AlphaGo de achttienvoudige menselijke wereldkampioen Lee Se-dol te verslaan. Volgens DeepMind is AlphaGo Zero waarschijnlijk de beste Go-speler ooit.

Niet geremd door mensen
Omdat het algoritme geen menselijke data gebruikt, wordt de computer ook niet door menselijke kennis geremd, stellen de makers. "AlphaGo kan zichzelf kennis aanleren vanuit de basisprincipes van het spel. Daarmee kan hij krachtiger worden dan de vorige versies." Het algoritme werkt daarnaast een stuk zuiniger.

De originele AlphaGo ging vorig jaar met pensioen. Het team van Googles DeepMind zei toen andere algoritmes te willen maken, die bijvoorbeeld moeten helpen om geneesmiddelen voor ziektes te vinden.