archetype

title

author

readings

tldr

outcomes

assignments

youtube

fhmedia

lecture-cg

Heuristiken

Carsten Gips (HSBI)

key	comment
Russell2020	Erweiterungen und Heuristiken: Abschnitte 6.2.2, 6.3, 6.5

key
Ertel2017

Minimax entwickelt den gesamten Spielbaum. Wenn nicht genug Zeit dafür zur Verfügung steht, kann man die Suchtiefe begrenzen. Für die Bewertung der Zustände benötigt man eine `Eval`-Funktion, die die Knoten in der selben Reihenfolge sortieren sollte wie es in der vollständigen Version über die `Utility`-Funktion geschieht. Die `Eval`-Funktion sollte zudem schnell zu berechnen sein. Typische Varianten für die `Eval`-Funktion sind gewichtete Features oder ein Nachschlagen in Spieldatenbanken (Spielzustand plus Bewertung). Minimax kann auf Spiele mit mehr als zwei Spielern erweitert werden. Dabei versucht dann jeder Spieler für sich, das Ergebnis des Spiels (aus seiner Sicht) zu maximieren. Bei Spielen mit Zufall (Würfelereignisse) kann man jedem Würfelereignis eine Wahrscheinlichkeit zuordnen und damit den jeweils erreichbaren `Max`- oder `Min`-Wert gewichten. Die Summe dieser gewichteten Bewertungen ist die Bewertung des entsprechenden "Chance"-Knotens, der dann in der darüberliegenden Ebene nach dem Minimax-Prinzip ausgewertet wird (=> *Expectimax*).

k2
Minimax für mehr als zwei Spieler

k2
Minimax mit Zufallskomponente

k2
Optimierungsmöglichkeit: Sortierung der Nachfolger => Heuristik

k2
Optimierungsmöglichkeit: Suchtiefe beschränken => Übergang zu Bewertungsfunktion

k2
Optimierungsmöglichkeit: Bewertung über Spieldatenbanken

k3
Minimax-Algorithmus

k3
Tiefenbeschränkung und Bewertungsfunktion bei Minimax

topic
sheet-games

link	name
https://youtu.be/rKqNqYBXuK8	VL Heuristiken

link	name
https://www.hsbi.de/medienportal/m/e5d279fef94d9a37e3b5d15fe9f807e024152e4c65a5a1110bab7871aff45828dba25d086e6a24f6a3a14111304b15f31c9844ff04473788595054d406790a59	VL Heuristiken

Wenn die Zeit nicht reicht: Suchtiefe begrenzen

Einführung neuer Funktionen:
1. Cutoff-Test statt Terminal-Test
  
  Beispielsweise bei erreichter Tiefe oder Zeitüberschreitung
\smallskip
1. Eval statt Utility
  
  Bewertung der erreichten Position (statt nur Bewertung des Endzustandes)

\bigskip

Bedingungen an Eval:
1. Endknoten in selber Reihenfolge wie bei Utility
2. Schnell zu berechnen (!)

Beispiel Schach

Mögliche Evaluierungskriterien:
- Materialwert: Bauer 1, Läufer/Springer 3, Turm 5, Dame 9
- Stellungsbewertung: Sicherheit des Königs, Stellung der Bauern
- Daumenregeln: 3 Punkte Vorteil => sicherer Sieg

\smallskip

Nutzung gewichteter Features $f_i$: \quad $\operatorname{Eval}(s) = w_1f_1(s) + w_2f_2(s) + \ldots$
- [Beispiel: ]{.notes} $w_1 = 9$ und $f_1(s)$ = (# weiße Königinnen) - (# schwarze Königinnen)

\bigskip

Alternativ: Speicherung von Positionen plus Bewertung in Datenbanken \newline => Lookup mit $\operatorname{Eval}(s)$ [(statt Berechnung zur Laufzeit)]{.notes}

Minimax mit mehreren Spielern

::: slides \bigskip {width="90%"} :::

::: notes {width="50%"} :::

[[Tafelbeispiel]{.bsp}]{.slides}

::: notes Hier maximiert jeder Spieler sein eigenes Ergebnis. Im Grunde müsste diese Variante dann besser "Maximax" heissen ...

Wenn es an einer Stelle im Suchbaum mehrere gleich gute (beste) Züge geben sollte, kann der Spieler Allianzen bilden: Er könnte dann einen Zug auswählen, der für einen der Mitspieler günstiger ist. :::

Zufallsspiele

{width="60%"}

[Quelle: "position-backgammon-decembre" by serialgamer_fr on Flickr.com (CC BY 2.0)]{.origin}

Backgammon: Was ist in dieser Situation der optimale Zug?

Minimax mit Zufallsspielen: ZUFALLS-Knoten

::: slides \bigskip {width="90%"} :::

::: notes {width="50%"} :::

::: notes Zusätzlich zu den MIN- und MAX-Knoten führt man noch Zufalls-Knoten ein, um das Würfelergebnis repräsentieren zu können. Je möglichem Würfelergebnis $i$ gibt es einen Ausgang, an dem die Wahrscheinlichkeit $P(i)$ dieses Ausgangs annotiert wird. :::

=> Für Zufallsknoten erwarteten Minimax-Wert (Expectimax) nutzen

[[Tafelbeispiel]{.bsp}]{.slides}

Minimax mit Zufall: Expectimax

Expectimax-Wert für Zufallsknoten $C$:

$$ \operatorname{Expectimax}(C) = \sum_i P(i) \operatorname{Expectimax}(s_i) $$

\bigskip

$i$ mögliches Würfelergebnis
$P(i)$ Wahrscheinlichkeit für Würfelergebnis
$s_i$ Nachfolgezustand von $C$ gegeben Würfelergebnis $i$

::: notes Für die normalen Min- und Max-Knoten liefert Expectimax() die üblichen Aufrufe von Min-Value() bwz. Max-Value().

Auf wikipedia.org/wiki/Expectiminimax finden Sie eine Variante mit einem zusätzlichen Tiefenparameter, um bei einer bestimmten Suchtiefe abbrechen zu können. Dies ist bereits eine erweiterte Version, wo man beim Abbruch durch das Erreichen der Suchtiefe statt Utility() eine Eval()-Funktion braucht. Zusätzlich kombiniert der dort gezeigte Algorithmus die Funktionen Expectimax(), Min-Value() und Max-Value() in eine einzige Funktion.

Eine ähnliche geschlossene Darstellung finden Sie im [@Russell2020, S. 212].

Hinweis: Üblicherweise sind die Nachfolger der Zufallsknoten gleich wahrscheinlich. Dann kann man einfach mit dem Mittelwert der Bewertung der Nachfolger arbeiten. :::

Wrap-Up

Minimax:
- Kriterien zur Begrenzung der Suchtiefe, Bewertung Eval statt Utility
- Erweiterung auf $>2$ Spieler
- Erweiterung auf Spiele mit Zufall: Expectimax

::: slides

LICENSE

Unless otherwise noted, this work is licensed under CC BY-SA 4.0.

Exceptions

Image "position-backgammon-decembre" by serialgamer_fr on Flickr.com (CC BY 2.0) :::

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

games3-heuristics.md

games3-heuristics.md

Wenn die Zeit nicht reicht: Suchtiefe begrenzen

Beispiel Schach

Minimax mit mehreren Spielern

Zufallsspiele

Minimax mit Zufallsspielen: ZUFALLS-Knoten

Minimax mit Zufall: Expectimax

Wrap-Up

LICENSE

Exceptions

Files

games3-heuristics.md

Latest commit

History

games3-heuristics.md

File metadata and controls

Wenn die Zeit nicht reicht: Suchtiefe begrenzen

Beispiel Schach

Minimax mit mehreren Spielern

Zufallsspiele

Minimax mit Zufallsspielen: ZUFALLS-Knoten

Minimax mit Zufall: Expectimax

Wrap-Up

LICENSE

Exceptions