Dann ist der ESP8266 ein Client (wie das Handy) und der ESP32 ein Server, der sich den Status merkt.
Der Einfachheit halber braucht der ESP8266 ja nicht die gleiche Webseite aufzurufen, sondern fragt nur den Status ab. Da gibt es zig Möglichkeiten: JSON bis einfachster Text