אפשר להמיר את המחרוזת לקידוד רגיל, לעבוד עליה ואז להמיר לUTF8(אפשרי אם יש בה רק עברית ואנגלית)
ויש בPHP
http://www.php.net/manual/en/ref.mbstring.php
(פונקציות לעבודה על מחרוזות שכל תו אמור להיות 2byte)
רק חבל שזה לא מובנה בתוך המנוע וצריך לאפשר את זה.
וראיתי באתר phpclasses (אתר ששווה להציץ בו תמיד!)
מחלקה שיכולה לעשות את העבודה:
http://www.phpclasses.org/browse/file/16999.html