07.12.2017, 18:40 Uhr Gerade keine Zeit?

Hinweis: Wir haben in diesem Artikel Provisions-Links verwendet und sie durch "*" gekennzeichnet. Erfolgt über diese Links eine Bestellung, erhält t3n.de eine Provision.

Die Google-KI Alphazero hat in nur vier Stunden ohne weitere Vorkenntnisse Schach gelernt – und das bisher beste Schachprogramm geschlagen. Bei Shogi und Go lief es ähnlich.

Anzeige

Strategiespiele: Google-KI Alphazero schlägt die besten Programme

Die auf die Entwicklung künstlicher Intelligenz (KI) spezialisierte als ihre KI Alpha Go einen der weltbesten Spieler im Brettspiel Go schlug. Das galt bei diesem komplexen Spiel bis dahin als nicht möglich. Jetzt melden die Deepmind-Entwickler einen neuen Erfolg. Die KI Alphazero hat die Strategiespiele Schach, Shogi und Go selbstständig gelernt und die jeweils besten Programme in den jeweiligen Disziplinen nach wenigen Stunden schlagen können.

Nix mehr verpassen: Die t3n Newsletter zu deinen Lieblingsthemen! Die t3n Newsletter zu deinen Lieblingsthemen! Jetzt anmelden

Schach etwa lernte Alphazero nur anhand der Regeln und durch ständiges Spielen gegen sich selbst. Innerhalb von vier Stunden war die KI besser als das derzeit führende Schachprogramm Stockfish, mit dem sich die meisten Schachprofis auf ihre Partien vorbereiten, wie Chess.com berichtet. Alphazero setzte sich dabei in 100 Spielen mit 28 Siegen und 72 Unentschieden durch, die KI verlor kein einziges Mal. Ganz ähnlich lief es bei Shogi und Go, wo Alphazero ebenfalls nach nur wenigen Stunden Übung die auf diesen Gebieten besten Programme schlug.

Das Besondere an der Leistung der Deepmind-Entwickler mit Alphazero ist, dass ihre KI die drei recht unterschiedlichen Strategiespiele mit demselben Verfahren meisterte. Bei Alpha Go und dessen Nachfolgern war die Architektur der neuronalen Netze noch stark auf Go ausgerichtet gewesen, wie Heise Online berichtet. Für Schachspieler interessant dürfte vor allem sein, dass Alphazero selbstständig die populärsten Eröffnungen – wie die Englische Eröffnung und das Damengambit – für sich entdeckte und einige davon wieder verwarf.

Alphazero: Viel Rechenpower hinter der Google-KI

Anzeige

Dass Alphazero so schnell lernen kann, liegt allerdings auch in der dahinterstehenden Rechenpower begründet. Zum Einsatz kamen während des Trainings laut dem Deepmind-Paper, das man sich hier anschauen kann, 5.000 Tensor-Processing-Units (TPU) der ersten und 64 TPUs der zweiten Generation, die deutlich schneller arbeiten als CPU und GPU. Die erste TPU-Generation etwa kann 92 Tera-Operationen pro Sekunde durchführen. Beim Spiel selbst wurden aber nur vier TPUs eingesetzt, um den Vergleich fair zu halten, wie Heise Online schreibt.

Mehr zum Thema: