Aproximační Algoritmy

10. 1. 2022 · Poznámky · 34 min čtení · 🇨🇿 · dostupné v PDF · [upravit]

Úvodní informace

Tato stránka obsahuje moje poznámky z přednášky Jiřího Sgalla z akademického roku 2021/2022 (MFF UK). Pokud by byla někde chyba/nejasnost, nebo byste rádi něco přidali, tak stránku můžete upravit pull requestem (případně mi dejte vědět na mail).

Základní definice

Definice (Optimalizační problém) je $\mathcal{I}, \mathcal{F}, f, g$

$\mathcal{I} \ldots$ $I \dots$ množina všech vstupů/instancí
- množina všech ohodnocených grafů
$\forall I \in \mathcal{I}: \mathcal{F}(I) \ldots$ $\forall I \in I : F (I) \dots$ množina přípustných řešení
- pro daný ohodnocený graf všechny kostry
$\forall I \in \mathcal{I}, A \in \mathcal{F}(I): f(I, A) \ldots$ $\forall I \in I, A \in F (I) : f (I, A) \dots$ účelová funkce
- součet hran na kostře
$g \ldots$ $g \dots$ bit (zda chceme maximalizovat nebo minimalizovat)
- maximalizujeme

Definice (NP-Optimalizační problém) je $\mathcal{I}, \mathcal{F}, f, g$ , pro které platí stejné věci jako pro normální optimalizační problémy, ale navíc

délka přípustných řešení $\le \mathrm{poly}(|I|)$ .
jazyk dvojic $(I, A), I \in \mathcal{I}, A \in \mathcal{F}(I)$ je v $P$ (rychle umíme ověřit, zda je řešení přípustné)
$f$ počitatelná v polynomiálním čase

Pro minimalizační zajišťujeme, že naše je vždy dostatečně malé.

Pro maximalizační zajišťujeme, že je vždy dostatečně velké.

Definice: algoritmus $A$ je $R$ -aproximační alg., pokud:

v polynomiálním čase v $|I|$ na vstupu $I$ najde $A \in \mathcal{F}(I)$
pro minimalizační problém: $\forall I: f(A) \le R \cdot \mathrm{OPT}(I)$
pro maximalizační problém: $\forall I: f(A) \ge \mathrm{OPT}(I) / R$

Pravděpodobnost v algoritmech

algoritmy s chybou: někdy dělají chybu, ale většinou ji neudělají
bez chyb, běží v průměrném čase polynomiálním

třída $\mathrm{NP}$ : jazyky, pro které existuje polynomiální algoritmus $A$ , který ověří správnost:
- $\forall a \in L\ \exists b: A(a, b) = 1$
- $\forall a \not\in L\ \forall b: A(a, b) = 0$
třída $\mathrm{RP}$ : jazyky, pro které existuje polynomiální algoritmus $A$ , který ověří správnost:
- $\forall a \in L\ \mathrm{Pr}_b\left[A(a, b)\right] \ge \frac{1}{2}$
- $\forall a \not\in L\ \mathrm{Pr}_b\left[A(a, b)\right] = 0$

Metrický TSP

Vstup: metrika $V, d$ $V, d$ na úplném ohodnoceném grafu
- metrika $\equiv$ $\equiv$ vrcholy splňují následující:
  1. trojúhelníková nerovnost
  2. symetrie
  3. $d(x, y) = 0 \iff x = y$
- pokud by to nebyla metrika, tak poly algoritmus neexistuje (jde převést na normální TSP)
Výstup: cyklus $C$ na všech vrcholech $V$
Cíl: minimalizovat $d(C)$

Kostrový algoritmus

Algoritmus (kostrový):

najdeme minimální kostru
navštívíme všechny vrcholy (například přes DFS), čímž dostaneme tah přes všechny vrcholy
zkrátíme ji na cyklus tak, že vynecháme opakující-se vrcholy

Věta: algoritmus je $2$ -aproximační.

Důkaz: kostra je nejvýše tak velká, jako optimální řešení a tenhle algoritmus je lepší než $2$ kostry (díky trojúhelníkové nerovnosti a symetrii – procházíme i tam i zpět)

Christofidesův algoritmus

(👀): brát hrany dvakrát je plýtvání – pospojujeme liché vrcholy přes minimální párování, abychom nemuseli chodit tam a zpět

najdeme minimální kostru $T$
najdeme minimální perfektní párování $M$ $M$ na vrcholech s lichými stupni v $T$ $T$
- vždy existuje, jelikož máme úplný graf a vrcholů s lichým stupňem je sudý počet
zkrátíme na cyklus $T \cup M$ $T \cup M$
- děláme je tak, že vybereme dvě hrany incidentní s vrcholem a nahradíme je za jednu

Věta: algoritmus je $3/2$ -aproximační.

Důkaz: $\mathrm{ALG} \le d(T) + d(M) \le \mathrm{OPT} + \frac{1}{2}\mathrm{OPT}$

Důkaz $d(M) \le \frac{1}{2}\mathrm{OPT}$ uděláme obrázkem:

Alespoň jeden z párování v cylku bude $\le \frac{1}{2} \mathrm{OPT}$ , jelikož celý cyklus je lepší optimální řešení.

Poznámka:

v realitě se algoritmus chová výrazně lépe, například až k faktoru $1.1$
dnes umíme $(\frac{3}{2} - \varepsilon)$ -aproximaci
TSP v rovině: existuje $(1 + \varepsilon)$ -aproximační schéma (ale stále je $\mathrm{NP}$ těžký)

Quicksort

Algoritmus (quicksort):

$|S| \le 1 \ldots$ konec, vystoupíme $S$ (base case)
jinak vybereme uniformě náhodně $p \in S$
$A = \left\{x \in S \mid x < p\right\}, B = \left\{x \in S \mid x > p\right\}$ $A = {x \in S ∣ x < p}, B = {x \in S ∣ x > p}$
- posloupnost má všechny prvky rozdílné, takže chceme ostrá nerovnítka
rekurzivně se zavoláme na $A, B$
vystoupíme $A, p, B$

Věta: quicksort má průměrnou časovou složitost $n \cdot \log n$ .

Pro připomenutí:

$\mathbb{E}\left[X_{i, j}\right] = \mathrm{Pr}\left[A_{i, j}\right]$ (indikátorová veličina)
$\mathbb{E}\left[X + Y\right] = \mathbb{E}\left[X\right] + \mathbb{E}\left[Y\right]$

Důkaz: počítáme $A_{i, j}$ – jev, že prvky $p_i$ a $p_j$ byly porovnány

zavedeme indikátorové veličiny $X_{i, j} = \begin{cases}1 & A_{i, j}\ \text{nastane} \\ 0 & \text{jinak}\end{cases}$

Lemma: nechť $i < j$ . Pak $\mathrm{Pr}\left[A_{i, j}\right] = \frac{2}{j - i + 1}$

Důkaz: to, že se dva prvky porovnají musí znamenat, že jeden z jich byl pivot, ale žádný mezi nimi pivot nebyl (jelikož by je to rozdělilo). Musíme tedy vybrat právě jeden z těchto dvou z intervalu $\left[i, j\right]$ , kde je celkově $j - i + 1$ čísel.

Sečtením přes všechny dvojice $i < j$ dostaváme následující:

\begin{aligned} \mathbb{E}\left[\#\ \text{porovnání}\right] &= \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} X_{i, j} \\ &= \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} \frac{2}{j - i + 1} \\ & = \sum_{i = 1}^{n - 1} \sum_{k = 2}^{n - i} \frac{2}{k} \\ & \cong n \cdot H_n \qquad H_n \ldots \text{harmonická posloupnost}\\ & \cong n \cdot \log n \end{aligned}

Konflikty v distribuovaných systémech

$n$ procesorů se snaží o přístup k jednomu zdroji
přímá komunikace není možná
v každém cylku může každý procesor požadovat přístup
- povede se pouze, když o něho žádá jeden

Algoritmus:

v každém cylku zkus s pravděpodobností $p$ $p$ přistoupit ke zdroji
- $p$ si nastavíme tak, aby to vyšlo hezky
opakuj, dokud se ti to nepovede

Věta: algoritmus s $p = \frac{1}{n}$ s pravděpodobností alespoň $1 - \frac{1}{n}$ uspěje po $t = 2 en \ln n$ cyklech.

Důkaz: modifikujme algoritmus, aby zkoušel přistupovat i po té, co ho získal (lehčí počítání, které pouze zhorší pravděpodobnost úspěchu).

Nechť $A_{i, r}$ je jev, že $i$ -tý proces uspěl v $r$ -tém cyklu. Pak

\mathrm{Pr}\left[A_{i, r}\right] = p \cdot \left(1 - p\right)^{n - 1} = \frac{1}{n} \left(1 - \frac{1}{n}\right)^{n - 1} \ge \frac{1}{en}

Nyní počítáme pravděpodobnosti jevů $F_{i, t}$ které říkají, že $i$ -tý proces neuspěje v žádném z $t = 2 en \ln n$ cyklů:

\mathrm{Pr}\left[F_{i, t}\right] = \prod_{r = 1}^{t} \left(1 - A_{i, r}\right) \le \left(1 - \frac{1}{en}\right)^t = \left(\left(1 - \frac{1}{en}\right)^{en}\right)^{\frac{t}{en}} \le n^{-2}

To, že existuje proces, který neuspěje, odhadneme jako

\mathrm{Pr}\left[\bigcup_{i = 1}^{n} F_{i, t}\right] \le \sum_{i = 1}^{n} \mathrm{Pr}\left[F_{i, t}\right] \le n \cdot n^{-2} = n^{-1} = \frac{1}{n}

Pravděpodobnost, že všechny procesy uspějí, je tak $1 - \mathrm{Pr}\left[\bigcup_{i = 1}^{n} F_{i, t}\right] \ge 1 - \frac 1 n$

Globální minimální řez

Vstup: neorientovaný graf $(V, E)$
Výstup: řez $F \subseteq E$
Cíl: minimalizovat $|F|$

Přímočarý algoritmus

Algoritmus:

převedeme graf na ohodnocený s jednotkovými cenami
zafixujeme vrchol $s$
pro všechny ostatní vrcholy $t$ najdeme minimalní $s-t$ řez
vrátíme minimum

umíme vyřešit řádové v $\mathcal{O}(n^3)$

Spojující algoritmus

Algoritmus:

vybereme náhodnou hranu a její vrcholy spojíme do jednoho
opakujeme, dokud nemáme pouze dva vrcholy
zbylé hrany na konci jsou náš řez

idea je to, že hran v minimálním řezu je málo a nejspíš se do nich netrefíme
pracujeme s multigrafy – při kontrakci zachováváme hrany
umíme ho implementovat rychle (řádově $\mathcal{O}(n^2 \cdot \log n)$ )
opravdu produkuje řez, protože vrcholy mezi výslednými komponentami danými vrcholy nemizí

(👀): multigraf s $n$ vrcholy a min. řezem velikosti $k$ má alespoň $nk/2$ hran.

každý vrchol sám o sobě tvoří řez, pak stačí přes všechny posčítat…

Věta: pravděpodobnost, že najdeme daný minimální řez $C$ je alespoň $\binom{n}{2}^{-1} = \frac{2}{n \cdot (n - 1)}$ .

Důkaz: Zafixujme některý globální minimální řez $C$ . Nechť $A_i$ jev, že v prvních $i$ iteracích jsme nevybrali hranu z $C$ .

$\mathrm{Pr}[A_0] = 1$ (žádnou jsme ještě nevybrali)
$\mathrm{Pr}[A_1] \ge 1 - \frac{k}{nk / 2} = 1 - \frac{2}{n}$
$\mathrm{Pr}[A_2 \mid A_1] \ge 1 - \frac{k}{(n-1)k/2} = 1 - \frac{2}{n - 1}$

Po $i$ iteracích máme $n-i$ vrcholů a minimální globální řez má velikost alespoň $k$ , takže máme alespoň $(n-i)\frac k 2$ hran, z čehož nejvýše $k$ hran je v $C$ . Obecně tak máme:

$\mathrm{Pr}[A_{i+1} \mid A_i] \ge 1 - \frac{2k}{(n-i)k} = \frac{n-i-2}{n-i}$
$\mathrm{Pr}[A_{i+1}] = \mathrm{Pr}[A_{i+1} \mid A_i] \cdot \mathrm{Pr}\left[A_i\right]$ , z čehož vyplývá:

\begin{aligned} \mathrm{Pr}[A_{n - 2}] & \ge \left(1 - \frac{2}{n}\right) \left(1 - \frac{2}{n -1}\right) \ldots \left(1 - \frac{2}{3}\right) \\ &= \frac{n - 2}{n} \frac{n - 3}{n - 1} \frac{n - 4}{n - 2} \ldots \frac{2}{4} \frac{1}{3} \\ &= \frac{2}{n \cdot (n - 1)} = \frac{1}{\binom{n}{2}} = \binom{n}{2}^{-1} \end{aligned}

Důsledek: každý graf $G$ má $\le \binom{n}{2}$ globálních minimálních řezů.

jeden takový je například cyklus $k = 2$ – ten má opravdu řádově tolik řezů

Důkaz: každý běh algoritmu vystoupí právě jeden řez. Kdyby jich bylo více, tak nám pravděpodobnost nevychází (jevy jsou disjunktní).

(👀): Pro $n^2$ opakování algoritmu výše dostáváme nejmenší řez s pravděpodobností $\ge \frac{1}{2}$

Poznámka: algoritmus můžeme vylepšit tak, že části, ve kterých se nejvíce dělají chyby (konkrétně ty pozdější) opakujeme vícekrát (a vezmeme minimum).

Rozvrhování

Vstup: $m$ strojů, $n$ úloh, každá o délce $p_i$
Výstup: rozklad $\left\{1, \ldots, n\right\} = I_1 \cup I_2 \cup \ldots \cup I_m$ (rozvržení úloh na stroje)
Cíl: minimalizovat $\max_{i=1}^{m} \sum_{j \in I_i}^{p_j}$ (délka nejdelšího stroje)

Hladový algoritmus

Algoritmus (hladový):

úlohu přidej vždy tam, kde jich je zatím nejméně
profit?

Věta (slabší odhad): hladový rozvrhovací algoritmus je $2$ -aproximační.

Důkaz: uvažme následující diagram:

Z obrázku vyplývá:

$T \le \mathrm{OPT}$ ( $T$ je minimum z délek rozvrhů všech front, takže jistě $T \le \mathrm{OPT}$ )
$p_j \le \mathrm{OPT}$ (optimum $p_j$ muselo použít)

Spojením dostáváme $\mathrm{ALG} = T + p_j \le 2 \cdot \mathrm{OPT}$

Věta (silnější odhad): hladový rozvrhovací algoritmus je $\left(2 - \frac{1}{m}\right)$ -aproximační.

Důkaz:

$\frac{1}{m} \sum_{k = 1}^{n} p_k \le \mathrm{OPT}$ $\frac{1}{m} \sum_{k = 1}^{n} p_{k} \leq OPT$
- lépe, než rovnoměrně všechny úlohy rozvrhnout nemůžeme
$\sum_{k = 1}^{n} p_k \ge m \cdot T + p_j$ $\sum_{k = 1}^{n} p_{k} \geq m \cdot T + p_{j}$
- součet všech úloh je alespoň součet před $T$ + poslední úloha (vynechám „ocásky“)

Kombinací nerovností dostávám $T + \frac{p_j}{m} \le \mathrm{OPT}$ .

Nyní místo odhadu $T \le \mathrm{OPT}$ použijeme tyto dva odhady:

\begin{aligned} T + \frac{p_j}{m} &\le \mathrm{OPT} \\ \\ p_j &\le \mathrm{OPT} \implies \left(1-\frac 1 m\right)p_j \le \left(1-\frac 1 m\right) \mathrm{OPT} \end{aligned}

Součtem dostáváme

\begin{aligned} \mathrm{ALG} = T + p_j = T + \frac{p_j}{m} + \left(1 - \frac{1}{m}\right) p_j &\le \mathrm{OPT} + \left(1 - \frac{1}{m}\right) \mathrm{OPT} \\ \mathrm{ALG} &\le \left(2 - \frac{1}{m}\right) \mathrm{OPT} \end{aligned}

Algoritmus lokálního prohledávání

Pro lokální algoritmus potřebujeme s rozvrhem pracovat formálněji:

Vstup: $m$ strojů, $n$ úloh, každá o délce $p_i$
Výstup: funkce přiřazující každé úloze startovní čas $s_i$ $s_{i}$ , koncový čas $c_i$ $c_{i}$ a stroj $i$ $i$
- musí platit že $c_i = s_i + p_i$ a že se úlohy nepřekrývají
Cíl: minimalizovat $\max_{i=1}^{m} \sum_{j \in I_i}^{p_j}$ (délka nejdelšího stroje)

Prostě přesouváme stroje, které končí nejpozději někam, aby začínaly dříve a zlepšujeme tím maximum.

Algoritmus (lokální prohledávání):

najdi libovolný rozvrh bez mezer (i na začátku)
vezmi libovolné $j$ $j$ s maximálním $c_j$ $c_{j}$
- pokud existuje stroj $i$ s délkou rozvrhu $< s_j$ , tak přesuň $j$ na $i$ s minimální délkou
- jinak vystup aktuální rozvrh

(👀): $c_{\min}$ neklesá

(👀): Každou úlohu přesuneme nejvýše jednou.

Důkaz: jelikož ji přesouváme na stroj s minimální délkou, tak by musel existovat nějaký s ještě menší, což by byl spor s tím, jak algoritmus funguje (dáváme na nejmenší).

Důsledek: algoritmus je polynomiální.

Věta (silnější odhad pro lokální algoritmus): algoritmus je $\left(2 - \frac{1}{m}\right)$ -aproximační.

Largest Processing Time (LPT)

Algoritmus (LPT):

úlohy uspořádáme tak, že $p_1 \ge p_2 \ge \ldots \ge p_n$
použijeme hladový algoritmus

Věta: LPT je $\left(\frac{4}{3} - \frac{1}{3m}\right)$ -aproximační algoritmus.

Důkaz: BUNO předpokládejme, že $p_n$ určuje délku rozvrhu (kdyby ne tak na další úlohy zapomenu a řešení se tím nezmění). Rozlišíme $2$ případy:

$p_n \le \frac{1}{3} \mathrm{OPT}$ $p_{n} \leq \frac{1}{3} OPT$ – stejný výpočet jako předtím, jen silnější nerovnost:
- $\mathrm{ALG} = T + p_n$ , $T + \frac{p_n}{m} \le \mathrm{OPT}$
- stejným výpočtem jako předtím máme $\mathrm{ALG} \le \mathrm{OPT} + \left(1 - \frac{1}{m}\right) \frac{1}{3} \mathrm{OPT}$
$p_n > \frac{1}{3} \mathrm{OPT}$ $p_{n} > \frac{1}{3} OPT$ – LPT vygeneruje optimální rozvrh
- víme, že délka poslední, a tedy každé úlohy je alespoň $\mathrm{OPT} / 3$
- žádný počítač nebude mít 3 úlohy, jelikož by pak byl větší než optimum
- chceme argumentovat, že LPT udělá stejné dvojice jako optimální rozvrh:
  - $p_m + p_{m + 1} \le \mathrm{OPT}$ $p_{m} + p_{m + 1} \leq OPT$ – uvážíme-li pouze prvních $m + 1$ $m + 1$ úloh, tak optimální rozvrh bude mít alespoň $2$ $2$ na jednom počítači a ty rozhodně nebudou kratší než dvě nejkratší
    - tento rozvrh s méně úlohami je jistě $\le \mathrm{OPT}$ , proto nerovnost platí
  - $p_{m - 1} + p_{m + 2} \le \mathrm{OPT}$ – v optimálním rozvrhu budou mít alespoň $2$ počítače dvojici úloh; v jedné z nich bude čtvrtá nejmenší ( $p_{m - 1}$ ), která tam bude s nejmenší ( $p_{m + 2}$ )
  - obdobně dostaneme všechny další dolní odhady…

Odbočka: online algoritmy

vstup přichází postupně
řešení musíme konstruovat postupně po krocích a pak už neměníme
hladový je online, lokální prohledávání není
pro $m = 2$ : lepší než $3/2$ -aproximační neexistuje (úlohy délky $\left\{1, 1, 2\right\}$ )
pro $m = 3$ je opět hladový nejlepší
pro $m > 3$ to už tak není (existují lepší)

Bin packing

Vstup: $a_1, \ldots, a_n \ge 0$
Výstup: rozklad $\left\{1, \ldots, n\right\} = I_1 \cup \ldots \cup I_m$ ${1, \dots, n} = I_{1} \cup \dots \cup I_{m}$ tak, že $\forall i: \sum_{j \in I_i} a_j \le 1$ $\forall i : \sum_{j \in I_{i}} a_{j} \leq 1$
- součet věcí v každém koši může být nejvýše $1$
Cíl: minimalizovat $m$ (počet košů)

Algoritmus (first fit): dej $a_j$ do prvního koše, do kterého se vejde.

Algoritmus (best fit): dej $a_j$ do nejplnějšího koše, do kterého se vejde.

Věta: oba algoritmy jsou $1.7$ -aproximační (a je to těsný odhad).

Věta: Je NP těžké najít $R$ -aproximační algoritmus pro $R \le 3/2$

Důkaz: Je NP těžké rozhodnout, zda $\mathrm{OPT} = 2$ , jelikož pomocí něho můžeme přímočaře vyřešit problém dělení množiny na dvě časti se stejným součtem (nastavíme velikost košů na tenhle součet), což je NP těžké.

Věta: Existuje asymptotické aproximační schéma, t. j.

$(\forall \varepsilon) (\exists \mathrm{ALG}) (\forall I) \mathrm{ALG}(I) \le (1 + \varepsilon)\mathrm{OPT}(I) + 1$

Algoritmus (any fit): dej $a_j$ do nějakého neprázdného koše; pokud nelze, dej ho do nového.

zahrnuje jak best fit, tak first fit

Věta: každý any fit algoritmus má aproximační poměr $\le 2$ .

Důkaz: Pro $\mathrm{OPT} = 1$ triviální. Jinak nechť $B_i = \sum_{j \in I_i} a_j$ . Musí platit, že $(\forall i, j, i \neq j) B_i + B_j > 1$ (jinak spor s během algoritmu). Posčítáním pro všechny dvojice dostáváme

\frac{m}{2} < \sum_{i = 1}^{m} B_i = \sum_{j = 1}^{n} a_j \le \mathrm{OPT}

Hledání disjunktních cest

Vstup:
- graf $G = (V, E)$ (orientovaný/neorientovaný)
- dvojice vrcholů $(s, t), \ldots, (s_k, t_k)$
- kapacita hran $c$
Výstup:
- $I \subseteq \left\{1, \ldots, k\right\}$ (dvojice které spojíme cestou)
- cesty $P_i, i \in I, P_i$ cesta z $s_i$ do $t_i$ tak, že každá hrana $e \in E$ leží na nejvýše $c$ cestách $P_i$
Cíl: minimalizovat $|I|$

Jednotkové kapacity

Algoritmus (hladový):

najdeme nejkratší cestu mezi nespojenou dvojicí (přes všechna $i$ $i$ )
- pokud neexistuje, tak vystoupíme
odebereme použité hrany

(👀): hladový algoritmus nemá aproximační poměr lepší než $\mathcal{O}(\sqrt{m})$ :

Délka $s_1 \mapsto t_1$ je $\mathcal{O}(k)$ . Abychom tuto cestu nezvolili, tak musejí mít ostatní alespoň $\mathcal{O}(k)$ hran a celkově jich tedy musí být řádově $m = \mathcal{O}(k^2)$ . Naše řešení je tedy o $k = \mathcal{O}(\sqrt{m})$ horší.

Věta: Hladový algoritmus s $c = 1$ je $\mathcal{O}\left(\sqrt{m}\right)$ -aproximační.

Důkaz: BUNO $\mathrm{OPT} \ge 1$ (jinak bychom hned skončili)

pak $|I| = \mathrm{ALG} \ge 1$ (také nějakou najdeme)

Nechť $I^*, \left\{P_i^* \mid i \in I^*\right\}$ je optimum. Počítejme cesty:

dlouhé cesty: $|P_i^*| > \sqrt{m}$ $∣ P_{i}^{*} ∣ > m$
- je jich $\le \sqrt{m}$ (jinak bych měl více než $m$ hran)
- ty mi tedy nic nekazí, jelikož nám stačí, že algoritmus najde nějakou cestu
krátké cesty:
- $i \in I \ldots\$ vše ok
- $i \not\in I \ldots\ P_i^*$ $i \neq \in I \dots P_{i}^{*}$ má nějakou společnou hranu s nějakou cestou $P_j$ $P_{j}$ t. ž. $|P_j| \le \sqrt{m}$ $∣ P_{j} ∣ \leq m$
  - ve chvíli, kdy algoritmus poprvé vybral cestu delší než $\sqrt{m}$ už nemohl vybrat $P_i^*$ , protože tu blokovala nějaká cesta, kterou již předtím zvolil (a ta musí být krátká)

Tedy počet krátkých cest $P_i^* \le \sum_{j \in I}\text{\#cest blokovaných $P_j$} \le \sum_{j\in I}1 + \sqrt{m} = |I| \cdot (1 + \sqrt{m})$

$1$ – náš algoritmus a optimum vybrali stejnou cestu
$\sqrt{m}$ – krátká cesta v našem řešení zablokuje nejvýše $\sqrt{m}$ ostatních krátkých $\mathrm{OPT} = |I^*| \le \underbrace{\sqrt{m}}_{\text{dlouhé}} + \underbrace{|I| \left(\sqrt{m} + 1\right)}_{\text{krátké}} \le \mathcal{O}(\sqrt{m}) |I| = \mathcal{O}(\sqrt{m}) \mathrm{ALG}$

Nejednotkové kapacity

Algoritmus (hladový pro nejednotkovou kapacitu):

zvolíme $\beta = \left\lceil m^{\frac{1}{c + 1}} \right\rceil$ , nastavíme $\forall e \in E: d(e) = 1$
najdeme nejkratší cestu mezi nespojenou dvojicí (přes všechna $i$ $i$ )
- pokud neexistuje nebo $d(P_i) \ge \beta^c$ , vystoupíme
přenásobíme délku hran nejkratší cesty faktorem $\beta$ a opakujeme

(👀): algoritmus nepoužije $e$ s $d(e) \ge m$

Důsledek: výsledné řešení je přípustné

po $c$ použitích hrany $e$ je $d(e) = \beta^c \approx m^{\frac{c}{c + 1}} < m$ , dále algoritmus hranu nepoužívá

Důsledek: algoritmus je polynomiální.

díky celočíselnosti $\beta$

Věta: Hladový algoritmus je $\mathcal{O}\left(\beta\right)$ -aproximační.

pro $c = 1$ máme $\beta = m^{\frac{1}{c + 1}} = \sqrt{m}$ , což odpovídá

Důkaz: BUNO optimum $\ge 1$ (jinak bychom hned skončili)

pak $|I| = \mathrm{ALG} \ge 1$ (také nějakou najdeme)

Opět si rozmyslíme to, když cesta je v našem algoritmu a když není:

$i \in I \ldots\$ vše ok
$i \not\in I \ldots\$ na konci algoritmu je $d(P_i^*) \ge \beta^c$ (jinak by ji algoritmus použil)

Nyní nejprve zesdola odhadneme $d(E)$ na konci algoritmu:

$\beta^c (|OPT| - |I|)$ $β^{c} (∣ OPT ∣ - ∣ I ∣)$ : dolní odhad na délku cest, které algoritmus nespojil ale optimální ano
- každá cesta má na konci delku alespoň $\beta^c$ a je jich alespoň $|\mathrm{OPT}| - |I|$
$d(E) \ge \beta^c (|\mathrm{OPT}| - |I|) / c$ : každou hranu můžeme použít $c$ -krát

Poté odhadneme $d(E)$ zeshora (opět na konci algoritmu):

na začátku $d(E) = m$ (délky hran jsou jednotkové)
po výběru $P_i \ldots\ d(P_i) \le \beta^c \cdot \beta = \beta^{c + 1}$
na konci $d(E) \le m + |I| \beta^{c + 1} \le \left(|I| + 1\right) \beta^{c + 1}$ $d (E) \leq m + ∣ I ∣ β^{c + 1} \leq (∣ I ∣ + 1) β^{c + 1}$
- $|I|$ je počet kroků, v každém jsme zvětšili délku vybrané cesty na $\beta^{c + 1}$
- druhá úprava je pouze z definice

Po spojení nerovnic dostáváme:

\begin{aligned} \beta^c \left(|\mathrm{OPT}| - |I|\right) &\le c \cdot d(E) \le c\left(|I| + 1\right) \beta^{c + 1} \\ |\mathrm{OPT}| - |I| &\le \beta c (|I| + 1) \\ |\mathrm{OPT}| &\le \mathcal{O}(\beta) |I| \\ \end{aligned}

Splnitelnost (MAX-SAT)

Vstup: $C_1 \land \ldots \land C_n$ $C_{1} \land \dots \land C_{n}$ , každá klauzule je disjunkcí $k_j \ge 1$ $k_{j} \geq 1$ literálů
- každá $C_j$ má váhu $w_j$ ( $= 1$ by default)
Výstup: ohodnocení $a \in \left\{0, 1\right\}^n$
Cíl: maximalizovat $\sum w_i$ (pro $w_j = 1$ je to počet splněných klauzulí)

Poznámka:

MAX-3SAT: $k_j \le 3$ : NP těžké
2SAT: orientovaný graf, ve kterém různé literály implikují jiné
- $x_1 \land x_2$ implikuje $\overline{x}_1 \implies x_2$ (a obrácené)
- testujeme tedy, zda graf neobsahuje cyklus (protože by pak nešel splnit)
MAX-2SAT: NP těžké

Předpokládáme:

žádný literál se v klauzuli neopakuje
nejvýše jeden z $x_i, \overline{x}_i$ se vyskytuje v klauzuli

RAND-SAT

Algoritmus (RAND-SAT):

vybereme nezávisle náhodně všechny literály ( $p = 1/2$ )
profit?

Věta: RAND-SAT je $2$ -aproximační algoritmus.

Důkaz: pro každou klauzuli zavedeme indikátorovou proměnnou $Y_j$ .

pravděpodobnost, že $C_j$ není splňená je $\frac{1}{2^{k_j}}$

Díky tomu, že $k_j \ge 1$ máme $\mathbb{E}\left[Y_j\right] = \mathrm{Pr}\left[C_j\ \text{is satistied}\right] = 1 - \frac{1}{2^{k_j}} \ge \frac{1}{2}$ a tedy:

\mathbb{E}\left[\sum_{j = 1}^{m} w_j Y_j\right] \overset{\text{linearita}}{=} \frac{1}{2} \sum_{j = 1}^{m} w_j \ge \frac{1}{2}\mathrm{OPT}

Poznámka: pro $k = 3$ dostáváme po dosazení $\frac{8}{7}$ -aproximaci

$\forall \varepsilon > 0: \left(\frac{8}{7} - \varepsilon\right)$ -aproximace MAX-3SATu je NP úplná

Předchozí algoritmus měl problémy s krátkými klauzulemi, jelikož je menší šance, že nějakou splní. Zkusíme to napravit tím, že jim budeme dávat preferenci.

BIASED-SAT

Algoritmus (BIASED-SAT):

vybereme nezávisle náhodně všechny hodnoty $a_i \in \{0,1\}$ takto:

pokud se $x_i$ vyskytuje jako jednoprvková klauzule častěji než $\neg x_i$ , pak zvol $a_i = 1$ s pravděpodobností $\phi - 1 = \frac{\sqrt{5} - 1}2$ , jinak $a_i = 0$
pro všechny ostatní $i$ zvol $a_i = 0$ s pravděpodobností $\phi - 1$ , jinak $a_i = 1$

Věta: BIASED-SAT je $\left(\phi - 1 = \frac{\sqrt{5} - 1}{2}\right)$ -aproximační algoritmus.

Z dvojice jednotkových klauzulí $(x_i)$ a $(\neg x_i)$ je vždy právě jedna splněná, pro další analýzu je tak vynecháme. Zbývající jednotkové klauzule jsou splněny s pravděpodobností přesně $\phi - 1$ . Klauzule délky $k\ge 2$ jsou splněny s pravděpodobností $1 - (\phi - 1)^k \ge 1 - (\phi - 1)^2 = \phi - 1$ .

pravděpodobnost $\phi - 1$ jsme zvolili přesně kvůli tomu, aby platila tato poslední rovnost

Střední hodnota hodnoty výsledného řešení je tak: (pro stejné indikátorové veličiny $Y_i$ definované v důkazu pro “RAND-SAT”)

\begin{aligned} \mathbb{E}\left[\sum_{j = 1}^{m} w_j Y_j\right] &= \sum_{j = 1}^{m} w_j \mathbb{E}\left[Y_j\right] \\ &\ge \sum_{j \in U} w_j \cdot \mathrm{Pr}\left[C_j\ \text{je splněná}\right] \\ &\ge \sum_{j \in U} w_j \cdot (\phi - 1) \\ &\ge (\phi - 1) \cdot \mathrm{OPT} \end{aligned}

LP-SAT

Algoritmus (LP-SAT):

pro každou proměnnou si pořídíme binární proměnnou $y_i$ , pro každou klauzuli binární proměnnou $z_j$
postavíme lineární program s těmito proměnnými
- negaci zachytíme jako $1 - y_i$
- pro každou klauzuli chceme $z_j \le \sum_{\text{kladné}} y_i + \sum_{\text{záporné}} (1 - y_i)$
- maximalizujeme $\sum z_j$
zrelaxujeme program a vyřešíme ho (dostaneme optimum $y^*, z^*$ )
nastavíme proměnné $x_i$ na true s pravděpodobností $y_i^*$

Věta: LP-SAT je $\left(1 - \frac{1}{e}\right)$ -aproximační algoritmus.

Fakt (A - A/G nerovnost): $\prod_{i = 1}^{n} a_i^{\frac{1}{n}} \le \frac{1}{n} \sum_{i = 1}^{n} a_i$

Fakt (B - konvexní funkce): pokud je funkce na $\left[0, 1\right]$ konkávní a $f(0) = a, f(1) = a + b$ , pak

\forall x \in \left[0, 1\right]: f(x) \ge a + bx

Fakt (C - odhad na 1/e): $\left(1 - \frac{1}{n}\right)^n \le \frac{1}{e}$

Důkaz: uvažme $y^*, z^*$ a $C_j$ s délkou $k_j$ ; pak

\begin{aligned} \mathrm{Pr}\left[C_j\ \text{není splněná}\right] &= \overbrace{\prod_{i: x_i \in C_j} (1 - y^*_i)}^{\text{kladné}} \overbrace{\prod_{i: \overline{x}_i \in C_j} y^*_i}^{\text{záporné}} & \\ &\overset{A}{=} \left[\frac{1}{k_j} \left(\sum_{i: x_i \in C_j} (1 - y^*_i) + \sum_{i: \overline{x}_i \in C_j} y^*_i\right)\right]^{k_j} & \\ &= \left[1 - \frac{1}{k_j} \left(\sum_{i: x_i \in C_j} y^*_i + \sum_{i: \overline{x}_i \in C_j} (1 - y^*_i)\right)\right]^{k_j} & \\ &\le \left(1 - \frac{z_j^*}{k_j}\right)^{k_j} \qquad & //\text{definice LP} \end{aligned}

Nás zajímá splnění, tedy:

\begin{aligned} \mathrm{Pr}\left[C_j\ \text{je splněná}\right] &\ge \overbrace{1 - \left(1 - \frac{z_j^*}{k_j}\right)^{k_j}}^{f(z_j^*)} \\ & \overset{B}{\ge} \left[1 - \left(1 - \frac{1}{k_j}\right)^{k_j}\right] z_j^* & \overset{C}{\ge} \left(1 - \frac{1}{e}\right) z_j^* \end{aligned}

Pro fakt $B$ jsme pozorovali, že $a = f(0) = 0$ a také že druhá derivace je nekladná. Pak:

\begin{aligned} \mathbb{E}\left[\sum_{j = 1}^{m} w_j Y_j\right] &= \sum_{j = 1}^{m} w_j \mathbb{E}\left[Y_j\right] \\ &\ge \sum_{j \in U} w_j \cdot \mathrm{Pr}\left[C_j\ \text{je splněná}\right] \\ &\ge \sum_{j \in U} w_j \cdot \left(1 - \frac{1}{e}\right) z_j^* \\ &= \left(1 - \frac{1}{e}\right) \mathrm{OPT}\\ \end{aligned}

BEST-SAT

Algoritmus (BEST-SAT):

při přiřazení s pravděpodobností $1/2$ použijeme RAND-SAT, jinak použijeme LP-SAT
zažijeme existenční krizi z toho, že takovýhle algoritmus funguje a je asymptoticky optimální

Věta: BEST-SAT je $\frac{3}{4}$ -aproximační.

Důkaz: chceme dokázat, že $\mathrm{Pr}\left[C_j\ \text{je splněná}\right] \ge \frac{3}{4} z^*_j$ .

Podívejme se, s jakou pravděpodobností splní klauzuli algoritmy:

RAND-SAT: $1 - \frac{1}{2^k}$ (alespoň jedna musí být splněná a volíme s $p = 1$ )
LP-SAT: $\left[1 - \left(1 - \frac{1}{k}\right)^{k}\right] z_j^*$ (formulka z minulého důkazu těsně před odhadem)

$k_j$	RAND-SAT	LP-SAT	BEST-SAT
$1$	$\frac{1}{2} \ge \frac{1}{2} z_j^*$	$1 \cdot z_j^*$	$\frac{1}{2} \frac{1}{2} + \frac{1}{2} z_j^* \ge \frac{3}{4} z_j^*$
$2$	$\ge \frac{3}{4} z_j^*$	$\frac{3}{4} \cdot z_j^*$	$\ge \frac{3}{4} z_j^*$
$\ge3$	$\ge \frac{7}{8} z_j^*$	$\ge\left(1 - \frac{1}{e}\right) \cdot z_j^*$	$> \frac{3}{4} z_j^*$

Poznámka (derandomizace metodou podmíněných pravděpodobností): postupně plníme klauzule tak, že náhodně vybíráme pravděpodobnosti. Jelikož počet splnění určuje to, jak hodnoty vybereme, tak je můžeme vybírat (podmíněně se rozhodujeme, jak to dopadne, když $x_i = 0$ nebo $x_i = 1$ a vybereme si to lepší). Aproximační poměr si neshoršíme, jelikož vždy vybírám větší z pravděpodobností.

Pokrývací problémy

Vrcholové pokrytí

Vstup: graf $G$ , ceny vrcholů $c_v \ge 0$
Výstup: $W \subseteq V$ tak, že $\forall e \in E: |e \cap W| \neq 0$
Cíl: minimalizovat $c(W) = \sum_{v \in W} c_v$

Algoritmus (LP relaxace):

vytvoř celočíselný lineární program:
- proměnné jsou binární podle vrcholů, které vybíráme
- podmínky jsou $\forall (u, v) \in E: x_u + x_v \ge 1$ (chceme pokrýt všechny hrany)
- minimalizujeme $\sum_{v \in V} x_v c_v$
zrelaxuj lineární program (proměnné jsou teď reálné)
použij ho při řešení – zvol $v$ $v$ když $x_v \ge \frac{1}{2}$ $x_{v} \geq \frac{1}{2}$
- dává správné řešení, jelikož pro splnění podmínek je vždy alespoň jeden z $(x_u, x_v) \ge \frac{1}{2}$

Věta: algoritmus je $2$ -aproximační.

Důkaz: proměnné jsme z $\ge \frac{1}{2}$ zaokrlouhlovali na $1$ , čímž jsme řešení max. zdvojnásobili.

Množinové pokrytí

Máme množiny, které mají nějaké ceny. Chceme je vybrat tak, aby jejich sjednocení obsahovalo všechny prvky a aby cena byla minimální.

Vstup: množiny $S_1, \ldots, S_m \subseteq \left\{1, \ldots, n\right\}$ , ceny $c_1, \ldots, c_m \ge 0$
Výstup: $I \subseteq \left\{1, \ldots, m\right\}$ t. ž. $\bigcup_{i \in I} S_i = \left\{1, \ldots, n\right\}$
Cíl: minimalizovat $\sum_{i \in I} c_i$

Pro rozbor budeme potřebovat ještě dva parametry:

v kolika nejvíce množinách je nějaký prvek $f = \max_{e = 1}^{n} |\left\{j \mid e \in S_j\right\}|\$
velikost největší množiny $g = \max_{j = 1}^{m} |S_j| \le n\$

(👀): vrcholové pokrytí je množinové pokrytí s $f \le 2$

Program pro vrcholové pokrytí:

proměnné jsou binární podle vrcholů, které vybíráme
podmínky jsou $\forall (u, v) \in E: x_u + x_v \ge 1$ (chceme pokrýt všechny hrany)
minimalizujeme $\sum_{v \in V} x_v c_v$

$f$ -aproximační algoritmy

Algoritmus (LP relaxace):

vytvoř celočíselný lineární program:
- proměnné jsou $x_1, \ldots, x_m \ge 0$ podle množin
- podmínky jsou $\forall e \in \left\{1, \ldots, n\right\}: \sum_{j \mid e \in S_i} x_j \ge 1$ (chceme pokrýt všechny prvky univerza)
- minimalizujeme $\sum_{i \in \left\{1, \ldots, m\right\}} x_i c_i$
zrelaxuj lineární program (proměnné jsou teď reálné)
použij ho při řešení – zvol $v$ $v$ když $x_v \ge \frac{1}{f}$ $x_{v} \geq \frac{1}{f}$
- dává správné řešení – argument je stejný jako u vrcholového pokrytí

Věta: algoritmus je $f$ -aproximační.

Důkaz: proměnné opět zvětšuji z $\frac{1}{f}$ na $1$ , řešení tedy zhorším nejvýše $f$ -krát.

Význam primáru (sběratel): jak můžu nejlevněji nakoupit balíčky známek tak, abych měl všechny známky.

Význam duálu (procejce): kolik můžu nejvíce účtovat za každou známku, aby byl obchod ochotný kupovat známky a tvořit z nich balíčky.

(👀): duál programu vypadá následně:

proměnné jsou $y_1, \ldots, y_n \ge 0$ pro každý prvek
podmínky jsou $\forall j \in \left\{1, \ldots, m\right\}: \sum_{e \in S_j} y_e \le c_j$
maximalizujeme $\sum_{e \in S_j} y_e$

(👀): podmínky komplementarity:

$\forall j: x^*_j = 0 \lor \sum y_e^* = c_j$ $\forall j : x_{j}^{*} = 0 \lor \sum y_{e}^{*} = c_{j}$
- pokud by prodejce na obálce vydělal, tak ji sběratel nekoupí
- pokud prodejce na známce nevydělává, tak ji sběratel koupí
$\forall e: y^*_e = 0 \lor \sum_{j \mid e \in S_j} x_j^* = 1$ $\forall e : y_{e}^{*} = 0 \lor \sum_{j ∣ e \in S_{j}} x_{j}^{*} = 1$
- pokud prodejce prodává známku zdarma, tak jí sběratel nakoupí trochu více
- pokud prodejce známku zdarma neprodává, tak jí sběratel nekoupí víc než potřeba

Algoritmus (primárně-duální algoritmus):

$y_1, \ldots, y_n = 0; I = \emptyset, E = \emptyset$
dokud existuje nepokryté $e \not\in E$ $e \neq \in E$ , tak zvyšíme $y_e$ $y_{e}$ „co nejvíce“:
- $\delta = \min_{j \mid e \in S_j} \left(c_j - \sum_{e \in S_j} y_e\right)$ $δ = min_{j ∣ e \in S_{j}} (c_{j} - \sum_{e \in S_{j}} y_{e})$
  - zvyšujeme tak, abychom splnili tu nejpřísnější duální podmínku
- $y_e = y_e + \delta$
- $\forall j: e \in S_j$ $\forall j : e \in S_{j}$ a $\sum_{e \in S_j} y_e = c_j$ $\sum_{e \in S_{j}} y_{e} = c_{j}$ přidám $j$ $j$ do pokrytí ( $I = I \cup \left\{j\right\}$ $I = I \cup {j}$ ) a $E = E \cup S_j$ $E = E \cup S_{j}$
  - do algoritmu přidáme ty množiny, jejichž podmínky komplementarity jsme naplnili

(👀): po přidání do algoritmu se $y_e$ prvku nezmění (ostře splníme nějakou rovnost)

Věta: algoritmus je $f$ -aproximační.

Důkaz: $\begin{aligned} \mathrm{ALG} &= \sum_{j \in I} c_j & // \text{definice} \\ &= \sum_{j \in I} \sum_{e \in S_j} y_e & // \text{definice} \\ &\le \sum_{e = 1}^{n} f \cdot y_e & // \text{prohození sumy + definice $f$} \\ &\le f \cdot \mathrm{OPT} & // \text{hodnota duálního řešení} \\ \end{aligned}$

$g$ -aproximační algoritmy

Algoritmus (hladový):

$I = \emptyset, E = \emptyset, q_e = 0$ $I = \emptyset, E = \emptyset, q_{e} = 0$
- $q$ $q$ je vektor indexovaný prvky, pomůže nám při analýze algoritmu
  - odpovídá ceně za pokrytí daného prvku
opakovaně ber „nejlepší“ množinu: přidáme množinu s minimálním $\left(p_j = \frac{c_j}{|S_j \setminus E|}\right)$ $(p_{j} = \frac{c _{j}}{∣ S _{j} ∖ E ∣})$
- $p_j$ odpovídá tomu, kolik zaplatíme za pokrytí nového prvku
- $\forall e \in S_j \setminus E: q_e = p_j$ (uložíme cenu nově pokrytých prvků)
- $I = I \cup \left\{j\right\}, E = E \cup S_j$ (přidáme tuto množinu a pokryté prvky)

Věta: algoritmus je $\left(H_g \approx \ln g \le \ln n\right)$ -aproximační

(👀): algoritmus nemůže být lepší (viz následující protipříklad):

(👀): $\mathrm{ALG} = \sum_{e = 1}^{n} q_e$

vyplývá z toho, že jsme cenu $p_j$ při přidávání rozdělili do $q_e$

Lemma: $\overline{q} = \frac{1}{H_g} \cdot q$ je přípustné řešení duálního LP

Důkaz: chceme dokázat, že $\sum_{e \in S_j} \overline{q}_e \le c_j$ (přímo podmínka v duálu). Nechť $S_j = \left\{e_1, \ldots, e_k\right\}$

očíslujeme tak, že $e_k$ je první pokrytý, $e_{k-1}$ druhý, až $e_1$ poslední

(👀): $q_{e_i} \le \frac{c_j}{i}$

v $i$ -tém kroku ještě nejsou pokryté prvky $1, \ldots, i$
z definice vybíráme nejlevnější možnou množinu

Nyní dostáváme

\begin{aligned} \sum_{e \in S_j} q_e &= \sum_{1}^{k} q_{e_i} \le \frac{c_j}{1} + \frac{c_j}{2} + \ldots = H_k \cdot c_j \\ \sum_{e \in S_j} \overline{q}_e &= \frac{1}{H_g} \sum_{e \in S_j} q_e \le \frac{1}{H_g} \cdot H_k \cdot c_j \le c_j \end{aligned}

Jelikož $\overline q$ je přípustné řešení duálu, pak ze slabé duality platí:

\mathrm{OPT} \ge \sum_{e \in E} \overline{q}_e = \frac 1 {H_g} \cdot \sum_{e \in E}q_e = \frac 1 {H_g} \mathrm{ALG}

Maximální nezávislá množina

Vstup: graf $G = (V, E)$
Výstup: $I \subseteq V$ $I \subseteq V$ nezávislá množina, maximální vzhledem k inkluzi
- největší moc dobře řešit nejde (ani aproximovat)

Nás zajímá najít rychlý paralelní algoritmus:

operací chceme udělat řádově $\mathcal{O}\left(\log n\right)$
k dispozici máme řádově $m$ procesorů (každý vrchol/hrana má jeden)
povolujeme procesorům najednou šahat na data a najednou měnit data na stejnou věc

Algoritmus (rychlý paralelní):

$I = \emptyset$
dokud $V \neq \emptyset$ $V \neq = \emptyset$ , tak každý následující krok děláme paralelně:
- $\forall v \in E$ pokud je stupeň $0$ , pak přidáme do $I$ a vymažeme z $V$
- $\forall v \in E$ označ $v$ (přidej do $S$ ) s pravděpodobností $\frac{1}{2 d_v}$ (nezávisle)
- $\forall u, v \in E$ $\forall u, v \in E$ pokud $u$ $u$ i $v$ $v$ jsou označené, odeber značku u vrcholu nižšího stupně
  - nižší stupeň proto, abychom odebírali hran co nejvíce
- přidej označené vrcholy do $I$ $I$ a odeber je a jejich sousedy (a odpovídající hrany) z $V$ $V$
  - sousedy množiny $S$ značíme $N(S)$

Chceme, aby se graf v každé iteraci zmenšil o nějakou část a iterací bylo tedy logaritmicky. Uděláme to počítání toho, že máme hodně dobrých hran a že jich hodně zmizí.

Definice: vrchol je dobrý, jestliže má $\ge \frac{d_v}{3}$ sousedů stupně $\le d_v$

má velkou pravděpodobnost, že ho vyřešíme výběrem souseda, protože má hodně sousedů malého stupně
analogicky špatný vrchol a dobrá (obsahuje dobrý vrchol) a špatná hrana

Lemma: alespoň polovina hran je dobrá.

Důkaz: hrany zorientujeme od menšího k většímu stupni (rovnost řešíme libovolně)

$v$ $v$ špatný $\implies d_v^{\mathrm{in}} < \frac{d_v}{3}$ $⟹ d_{v}^{in} < \frac{d _{v}}{3}$
- z definice – vstupující jsou stejného nebo menšího stupně, takže jich má málo, jinak by byl dobrý
- $> \frac{2 d_v}{3}$ $> \frac{2 d _{v}}{3}$ vstupuje a platí $d_v^{\mathrm{in}} \le \frac{1}{2} d_v^{\mathrm{out}}$ $d_{v}^{in} \leq \frac{1}{2} d_{v}^{out}$
  - „za každou špatnou hranu nejvýše dvě dobré“

Nyní počítáme

\begin{aligned} |\text{špatné hrany}| &\le \sum_{v\ \text{špatný}} d_v^{\mathrm{in}} &\qquad //\text{špatná hrana jde do špatného vrcholu} \\ &\le \sum_{v\ \text{špatný}} \frac{1}{2} d_v^{\mathrm{out}} &\qquad //\text{nerovnost výše} \\ &\le \sum_{v \in E} \frac{1}{2} d_v^{\mathrm{out}} \\ &\le \frac{1}{2}|E| \end{aligned}

Tedy dobrých je $\ge \frac{1}{2}|E|$ .

Pravděpodobnost, že dobrý vrchol odstraním (buď označením toho vrcholu samotného nebo nějakého jeho souseda) je

\alpha > 0

Lemma: existuje $\alpha > 0$ t. ž. $\forall v$ dobrý platí

$\mathrm{Pr}\left[v \in S \cup N(S)\right] \ge \alpha$
pravděpodobnost, že $v$ je označený nebo je označený některý jeho soused
přímo z toho plyne to, co chceme, jelikož dobré hrany jsou pouze u dobrých vrcholů

Důkaz: Pro dobrý vrchol $v$ platí následující:

\begin{aligned} \mathrm{Pr}\left[v\ \text{má souseda označeného v kroku 2}\right] &\ge 1 - \overbrace{\prod_{w \in N(v)} \left(1 - \frac{1}{2d_w}\right)}^{\text{neoznačíme žádného souseda}} \\ & \ge 1 - \left(1 - \frac{1}{2d_v}\right)^{\frac{d_v}{3}} \qquad // \text{lemma výše}\\ & \ge 1 - e^{-\frac 1 6} \\ & = \text{konstanta} \\ \end{aligned}

Může být špatné, když by se hodně ze sousedů dobrého vrcholu odstranilo. To dokážeme, že se nestane tím, že ukážeme, že u libovolného vrcholu $v$ odstraníme značku s $\le$ konstantní pravděpodobností (jen pozor, v $\mathrm{Pr}$ používáme podmíněně, že $v$ byl označený):

\begin{aligned} \mathrm{Pr}\left[\text{odstraníme značku}\right] &= \mathrm{Pr}\left[\text{je označený soused s větším stupněm}\right] \\ &= \mathrm{Pr}\left[\exists u \in N(v): d_u \ge d_w \land u\ \text{byl označený}\right] \\ &\le \sum_{u \in N(v) \mid d_u \ge d_v} \mathrm{Pr}\left[u\ \text{byl označený}\right] \\ &= \sum_{u \in N(v) \mid d_u \ge d_v}\frac 1 {2d_u} \\ &\le \sum_{u \in N(v) \mid d_u \ge d_v}\frac 1 {2d_v} \\ &\le d_v \cdot \frac 1 {2d_v} \\ &\le \frac{1}{2} \end{aligned}

Nikde v důkazu nepočítáme s pravděpodobností označení dobrého vrcholu, což nepotřebujeme.

Spojením odhadů dostaneme, že pro dobrý vrchol $v$ je $\mathrm{Pr}[v \in S \cup N(S)] \ge \alpha$ pro $\alpha = (1-e^{-\frac 1 6}) / 2$ .

Věta: očekávaný počet fází algoritmu je $\le \mathcal{O}(\log n)$

Důkaz: nechť $M_i =$ počet hran po $i$ fázích. Pak platí

\mathbb{E}[M_k] \le \left(1-\frac \alpha 2\right)^k \cdot \mathbb{E}[M_0] = \left(1-\frac \alpha 2\right)^k \cdot m

Pokud $\mathbb{E}[M_k] \le \frac 1 2$ , pak z Markovovy nerovnosti $\mathrm{Pr}[M_k \ge 1] \le \frac 1 2$ , takže $\mathrm{Pr}[M_k = 0] \ge \frac 1 2$ .

Aby $\mathbb{E}[M_k] \le \frac 1 2$ , pak musí platit

\begin{aligned} \left(1-\frac \alpha 2\right)^k \cdot m &\le \frac 1 2 \\ k \cdot \ln\left(1-\frac \alpha 2\right) + \ln(m) &\le \ln\left(\frac 1 2\right) \\ &\vdots \\ k \in \mathcal O (\log m) &= \mathcal O (\log n) \end{aligned}

Hashovací funkce

2-Univerzalita: pro dva rozdílné prvky máme pro náhodnou hashovací funkci z rodiny omezenou pravděpodobnost, že se namatchují na stejnou hodnotu.

Silná 2-univerzalita: zahashované hodnoty $x_1, x_2$ tvoří dvě náhodné po dvou nezávislé veličiny. Takže kromě toho, že jsou univerzální (když zafixuju jeden, tak se tím druhým trefím s pravděpodobností $\frac{1}{n}$ to platí i pro libovolnou dvojici, na kterou prvky mapuju.

Definice: nechť $M, |M| = m, N, |N| = n, H \subseteq \left\{f \mid f : M \mapsto N\right\}$

systém $H$ je $2$ -univerzální, jestliže
$\left(\forall x_1, x_2 \in M, x_1 \neq x_2\right)\\ \mathrm{Pr}_{h \in H} \left[h(x_1) = h(x_2)\right] \le 1 / n$
systém $H$ je silně $2$ -univerzální, jestliže
$\left(\forall x_1, x_2 \in M, x_1 \neq x_2\right) \left(\forall y_1, y_2 \in N\right)\\ \mathrm{Pr}_{h \in H} \left[h(x_1) = y_1 \land h(x_2) = y_2\right] = 1/n^2$

Příklad: pro $M = N$ je těleso máme silně 2-univerzální systém

H = \left\{h_{a,b} \mid a, b \in N\right\} \quad h_{a, b}: x \mapsto ax + b

Příklad: pro $|M| \gg |N|$ můžeme vzít $\overline{H} \subseteq \left\{f \mid f: M \mapsto M\right\}$ a vytvořit z něho $H \subseteq \left\{f \mid f: M \mapsto N\right\}$ tím, že budeme brát funkce $\mathrm{mod} n$

$\overline{H}$ $\overline{H}$ silně $2$ $2$ -univerzální $\implies H$ $⟹ H$ univerzální
- pokud $n \mid m$ , tak máme silnou univerzalitu

Dynamický slovník

Příklad (dynamický slovník): universum $M$ , $|M| = 2^d$ , slovník $S \subseteq M, |S| = s$

reprezentujeme $S$ tabulkou $N, |N| = n = \mathcal{O}(s)$
operace (trvá průměrně $\mathcal{O}(1)$ $O (1)$ ):
- vložení do $S$
- vyhledávání $x$ v $S$
- vymazání $x$ z $S$

Zvolíme $n \in \left[s, 2s\right], H, h \in H$ náhodně uniformně:

$h(x)$ je očekávaná pozice v poli
kolize se přidávají do spojového seznamu pole ( $n_i$ je počet prvků)

Lemma: pokud $n = \mathcal{O}(s)$ , tak průměrná doba operace je $\mathcal{O}(1)$

Důkaz: chceme ( $\forall x \in S)\ \mathbb{E}\left[n_{h(x)}\right] = \mathcal{O}(1)$ . Budeme počítat počet kolizí na jeden prvek:

nechť $X_y = \begin{cases} 1 & h(y) = h(x) \\ 0 & \text{jinak} \end{cases}$
jelikož $(\forall x, y, x \neq y)\ h(x), h(y)$ jsou nezávislé, tak $\mathbb{E}\left[X_y\right] = \frac{1}{n}$ :

\mathbb{E}\left[n_{h(x)}\right] = \overset{\text{prvek}\ x}{1} + \overbrace{\sum_{y \neq x} \mathbb{E}\left[X_y\right]}^{\#\ \text{kolizí} = \text{délka}\ n_{h(x)}} = 1 + \frac{s - 1}{n} = \mathcal{O}(1)

Statický slovník

Příklad (statický slovník): $S$ je dáno předem

vytvoříme datastrukturu v polynomiálním čase
chceme, aby operace vyhledání běžela v maximálním čase $\mathcal{O}\left(1\right)$ $O (1)$
- to jsme předtím neměli – seznam mohl být dlouhý a maximální počet operací velký
použijeme tabulky dvě:
- hashujeme dvakrát – jednou pro index do první tabulky, ta určí funkci pro druhé hashování
- v první budeme chtít $\le n$ kolizí, ve druhé $= 0$

v první tabulce máme přihrádky velikosti $n_i$ , pro každou z nich pak vytvoříme další tabulku velikosti $n_i^2$
vybereme $h \in H$ $h \in H$ tak, že má $\le n$ $\leq n$ kolizí
- kolize $C = \left\{\left\{x, y\right\} \mid x, y \in M, x \neq y, h(x) = h(y)\right\}$

Lemma: existuje $h \in H$ s počtem kolizí $\le n$ .

Důkaz: $\mathbb{E}\left[|C|\right] \overset{2-\text{univ}}{\le} \binom{s}{2} \frac{1}{n} \overset{s \le n}{\le} \binom{n}{2} \cdot \frac{1}{n} \le \frac{n}{2}$

- pokud vybereme uniformně náhodně hashovací funkci z $h \in H$, pak dle Markovovy nerovnosti $\mathrm{Pr}[|C| \ge n] \le \frac {\mathbb{E}[|C|]} n \le \frac 1 2$ - každá druhá taková funkce má $\le n$ kolizí

Lemma: existuje $h_i \in H$ s počtem kolizí $0$ .

Důkaz: $\mathbb{E}\left[|C_{n_i}|\right] \le \binom{n_i}{2} \cdot \frac{1}{n_i^2} \le \frac{1}{2}$

- opět dle Markovova pro uniformně náhodně vybranou $h\in H$ máme $\mathrm{Pr}[|C_{n_i}| \ge 1] \le \mathbb{E}[|C_{n_i}|] \le \frac 1 2$ - každá druhá taková funkce má 0 kolizí

(👀): $|C| = \sum_{i = 1}^{n} \binom{n_i}{2} = \sum \frac{n_i^2}{2} - \sum \frac{n_i}{2}$

počet prvků kolidující do daného políčka je $n_i$ , počet dvojic je tedy výraz nahoře

Výpočtem dostáváme $\sum n_i^2 \le 2 |C| + \sum n_i \le 2n + s = \mathcal{O}(s)$

Testování

Násobení matic

pomalé násobení: $\mathcal{O}(n^3)$
nejlepší známé: $\mathcal{O}(n^{\omega})$
- $\omega = 2.37$
Vstup: $A, B, C \subseteq K^{n \times n}$ (pro těleso $K$ )
Výstup: ANO, pokud $A \cdot B = C$ , jinak NE

Lemma: nechť $\vec{a} \in K^n, \vec{a} \neq 0$ a $\vec{x} \in \left\{0, 1\right\}^n$ uniformně náhodný. Pak

$\mathrm{Pr}_{\vec{x}} \left[\vec{a}^T \cdot \vec{x} \neq 0\right] \ge \frac{1}{2}$

Důkaz: uvažme poslední nenulovou souřadnici $\vec{a}_k$ . Ta má hodnotu $0$ nebo $\vec{a}_k$ , podle vybraného bitu. $0$ bude tedy právě tehdy, když součet předchozích vyšel $a_k$ (a opakujeme s $k-1, \ldots$ ).

Věta: existuje pravděpodobnostní algoritmus s jednostrannou chybou pro testování maticového násobení v čase $\mathcal{O}\left(n^2\right)$

když platí, tak vždy řekne že platí
když neplatí, tak udělá chybu s nějakou pravděpodobností (konkrétně $\le \frac{1}{2}$ )

Algoritmus:

vezmi náhodný $\vec{x} \in \left\{0, 1\right\}^n$
vystup ANO, jestliže $A \cdot (B \cdot \vec{x}) = C \cdot \vec{x}$ , jinak NE

nejdříve vynásobíme $\vec x$ maticí $B$ , až pak maticí $A$ , abychom měli kvadratickou časovou složitost

(👀): algoritmus trvá $\mathcal{O}(n^2)$ kroků

(👀): algoritmus řekne ano $\iff \left(A \cdot B - C\right) \cdot \vec{x} = D \cdot \vec{x} = \vec{0}$

pokud $D = 0$ , pak algoritmus správně odpoví ANO
pokud $D \ne 0$ $D \neq = 0$ , pak algoritmus udělá chybu s pravděpodobností $\le \frac 1 2$ $\leq \frac{1}{2}$
- $D$ $D$ je nenulová matice, má tedy nenulový řádek
  - podle lemmatu platí $\mathrm{Pr}_{\vec{x}} \left[D \cdot \vec{x} \neq 0\right] \ge \frac{1}{2}$

Nulovost polynomů (Polynomial Identity Testing)

nezajímá nás, jestli je identicky nulový, ale zda je nulový v tělese, ve kterém pracujeme
uvažujeme více proměnných
- $d \ldots\$ celkový stupeň (t. j. součet stupňů v nějakém nenulovém monomu)
převeditelné na to, zda je výrok tautologie (jdou na sebe převést) $\implies$ NP těžké

Budeme používat trochu divný vstup:

Vstup: matice polynomů proměnných, determinant určuje náš polynom
Výstup: ANO, jestliže je polynom identicky nulový, jinak NE

Lemma: nechť $P(x_1, \ldots, x_n)$ je nenulový polynom nad $K$ stupně $\le d_i$ a $S \subseteq K$ konečná. Nechť $x_1, \ldots, x_n \in S$ unif. náhodně. Pak pravděpodobnost, že jsme se trefili do jednoho z kořenů z $S$ , je

$\mathrm{Pr}_{\vec{x}} \left[P(\vec{x}) = 0\right] \le \frac{d}{|S|}$
$n = 1 \ldots\$ polynom má nejvýše $d$ kořenů, ať zvolíme $s$ jakkoliv
je to dost šikovné, protože podle $|S|$ si volíme přesnost algoritmu (pro $|S| \ge 2d$ máme $\ge \frac{1}{2}$ )

Důkaz: pro $n =1$ platí. Nyní indukcí podle $n$ . Rozdělíme polynom na $A$ a $B$ , kde stupeň v $B$ je ostře menší $k$ . To umíme tím, že vytkneme nějakou proměnnou:

$P(\vec{x}) = x_1^k \cdot A(x_2, \ldots, x_n) + B(\vec{x})$ $P (x) = x_{1}^{k} \cdot A (x_{2}, \dots, x_{n}) + B (x)$
- $A$ je identicky nulový (podle IP) s pravděpodobností $\le \frac{d - k}{|S|}$
- chci dokázat, že $\mathrm{Pr}\left[P(\vec{x}) = 0 \mid A(x_2, \ldots, x_n) \neq 0\right] \le \frac{k}{|S|}$ $Pr [P (x) = 0 ∣ A (x_{2}, \dots, x_{n}) \neq = 0] \leq \frac{k}{∣ S ∣}$
  - při konkrétních hodnotách $x_2, \ldots, x_n$ se mi polynom vyhodnotí na nějaké číslo a zbytek polynomu $P(\vec{x})$ bude $\alpha x_1^k + \beta$ , což nebude mít více než $k$ kořenů

Nyní si uvědomíme, že

\begin{aligned} \mathrm{Pr}\left[P(\vec{x}) = 0\right] &\le \mathrm{Pr}[A(x_2, \dots, x_n) = 0] + \mathrm{Pr}[P(\vec{x}) = 0 \mid A(x_2, \dots, x_n) \ne 0] \\ &\le \frac{d - k}{|S|} + \frac{k}{|S|} = \frac{d}{|S|} \end{aligned}

Algoritmus:

vybereme dostatečně velké $S$ a uniformně náhodné ohodnocení proměnných $x_i$
pokud $P(\vec{x}) = 0$ , odpovíme, že je nulový, jinak že není

pokud je $P$ nulový, vždy odpovíme správně
pokud $P$ není nulový, pak uděláme chybu s pravděpodobností $\le \frac d {|S|}$

Perfektní párování

Nechť $(U, V, E)$ je bipartitní graf, $n = |U| = |V|$ . Pak Edmondsova matice grafu je $n \times n$ matice $B$ s

B_{u, v} = \begin{cases} x_{u, v} & uv \in E \\ 0 & uv \not\in E \end{cases}

za každou hranu bude v matici jedna proměnná

(👀): $\det(B)$ je polynom, jehož monomy vzájemně jednoznačně odpovídají perfektním párovaním.

sčítáme součin permutace matice a když se zrovna trefíme do párovaní, tak máme monom

Algoritmus (test existence PP):

zvolme uniformně náhodně nezávisle $x_{u, v} \in \left\{1, \ldots, 2n\right\}$ $x_{u, v} \in {1, \dots, 2 n}$
- $2n$ kvůli tomu, aby nám vyšlo NE správně s pravděpodobností $\ge \frac{1}{2}$
spočítáme determinant
- pokud je nenulový, párování určitě existuje
- pokud je nulový, tak párování neexistuje s pravděpodobností $\ge \frac{1}{2}$

Izolující lemma

Prvky $a_i$ budou hrany v grafu a množiny $S_j$ budou perfektní párování.

Chceme nějak zvolit váhy a ukázat, že nám nějak jednoznačně identifikují nějakou z množin (tedy perfektních párování).

Věta: Nechť máme systém množin $S_1, \ldots, S_n \subseteq \left\{a_1, \ldots, a_m\right\}$ s náhodně zvolenými vahami $w(a_1), \ldots, w(a_m) \in R, |R| = r$ . Pak

$\mathrm{Pr}\left[\exists\ \text{právě jedinná}\ S_j\ \text{s minimální}\ w(S_j)\right] \ge 1 - \frac{m}{r}$
pro naše použití budeme chtít $r = 2m$

Důkaz: $A_i \ldots\$ jev, že existují $S_k, S_l$ tak, ze $w(S_k) = w(S_l) = \min_j w(S_j)$ a $a_i \not\in S_k, a_i \in S_l$

existují dvě minimální množiny, které se liší v prvku $i$ (špatný jev)
když nenastane žádný s jevů $A_i$ , pak máme vyhráno, jelikož dvě minimální neexistují

Ukážeme, že $\mathrm{Pr}\left[A_i\right] \le \frac{1}{r}$ . $S_1, \ldots, S_n$ rozdělíme na dvě množiny podle $i$ :

$\mathcal{S}_0 = \left\{j \mid a_i \not\in S_j\right\}$
$\mathcal{S}_1 = \left\{j \mid a_i \in S_j\right\}$

Pokud $A_i$ nastane, pak platí

pro $S_k$ : $k \in \mathcal{S}_0, w(S_k) = \min_{j \in \mathcal{S}_0} w(S_j)$
pro $S_l$ : $l \in \mathcal{S}_1, w(S_l) = \min_{j \in \mathcal{S}_1} w(S_j)$

Pak (když zafixujeme všechny váhy a vybíráme váhu $a_i$ ) platí

\mathrm{Pr}_{w(a_i) \in R}\left[w(S_k) = w(S_l) \mid w(a_i'), i' \neq i\ \text{vybrána}\right] \le \frac{1}{r}

Součtem pro všechny množiny, dostáním opačného jevu a aplikací union boundu dostáváme hledanou nerovnost.

Algoritmus (rychlý paralelní algoritmus pro PP):

zvolíme rovnoměrně náhodně váhy $w(uv) \in \left\{1, \ldots, 2m\right\}$ pro každou hranu
zasubstituujeme do Edmondsovy matice následně: $x_{uv} = 2^{w(uv)}$ $x_{uv} = 2^{w (uv)}$
- $\mathrm{det}(C)\ldots\$ $det (C) \dots$ příspěvek PP je $\pm 2^{w(M)} = \pm \prod_{uv \in M} 2^{w(uv)}$ $\pm 2^{w (M)} = \pm \prod_{uv \in M} 2^{w (uv)}$
  - z definice determinantu (permutace nějakých indexů matice)
najdeme $W$ $W$ tak, že $2^W$ $2^{W}$ je maximální číslo tvaru $2^{\alpha}$ $2^{α}$ dělící $\mathrm{det}(C)$ $det (C)$
- zajímá nás poslední index, kde má determinant jedničku, jelikož to odpovídá unikátnímu PP (všechny PP jsou ve tvaru $0b1\underbrace{0000}_{w(uv)}$ )
$\forall uv \in E$ $\forall uv \in E$ spočítáme $d = \mathrm{det}(C^{uv})$ $d = det (C^{uv})$
- jestliže $2^{W - w(uv)}$ $2^{W - w (uv)}$ je max. číslo tvaru $2^{\alpha}$ $2^{α}$ dělící $d$ $d$ , pak přidáme $uv$ $uv$ do $M$ $M$
  - odpovídá tomu, zda párování přežilo odstranění hrany – pokud ne, tak ho přidáme
zkontrolujeme, že $M$ je PP (mohli jsme vygenerovat nesmysl)

Odkazy

Webová stránka předmětu
Odkaz na skripta (pozor, jsou vcelku nedopsaná)