voui, il y a du unicode la dessous...
En gros, au tout début du document tu as normalement un <doctype charset=...> qui indique le charset utilisé.
Tu as aussi à vérifier le header <<charset:>> envoyé par le serveur.
Enfin, certaines heuristiques permettent de déterminer quel est le charset utilisé quand aucune information n'est disponible.
Une fois que tu connais le charset utilisé par la page web, tu as une fonction PHP pour transformer des chaînes entre charsets UTF-8 (c.à.d international) et ISO-8859-1 (c.à.d français):
http://php.net/utf8_decode
Tu trouvera d'autres infos, notamment dans les commentaires des utilisateurs ici:
http://php.net/utf8_encode