Under söndagen kan bloggen bitvis vara omöjlig att nå. Jag har tröttnat på de ständiga problemen med de olika mer eller mindre fungerande spamfiltren, dessutom tror jag att en del av problemen består i att WordPress fungerar sämre med annan teckenuppsättning än UTF-8.
Jag har hela tiden använt iso-8859-1 trots att WP själva rekommenderar UTF-8. Att bara byta tvärt mitt under pågående drift låter sig inte göra. Växlar jag under drift så kommer samtliga åäö att se ut som svarta rutertecken i texten. Därför kommer jag troligen att starta en helt ny databas under eftermiddagen idag. De senaste dagarnas texter kommer att exporteras dit, men knappast några kommentarer.
Som parentes kan jag nämna att jag med den nuvarande databasen har haft närmare 1.800.000 besök på bloggen. Jag har skrivit 3 917 bloggposter och fått närmare 40 000 kommentarer.
Jag ska lite senare under dagen undersöka om det finns någon metod att exportera den nuvarande databasen och sedan importera den till en ny databas, men jag tvivlar på att det går. Dessutom tror jag inte att jag har några möjligheter att konvertera från iso-8859-1 till UTF-8.
Många har dessutom klagat över att bloggen är ”seg”. Det är något som jag tror delvis avhjälps om jag helt byter databas. Jag ska i så fall oxo försöka se till att den ”gamla” bloggen blir tillgänglig för läsning, dock ej för kommentarsskrivande. Jag har sedan lång tid tillbaka en ”testblogg” där jag testar lite olika plugins och skins till WordPress och jag funderar på att skicka alla sökningar som inte hittar sitt svar i en ny databas till ”testbloggen” som då blir en exakt kopia av denna. Men som sagt, utan kommentarsmöjligheter.
Så blir det konstigheter med driften under detta dygn så vet ni vad det beror på.
5 svar till “Meddelande angående http://jinge.se”
Jag kan inte påstå att jag avundas dig…har inte sett till många verktyg för teckentabellskonvertering, och att sitta med en ordbehandlare och korrigera allt manuellt är ungefär like roligt som att borra makaroner :p
Lycka till med uppdateringen :)
Jinge i php finns en function
”utf8_encode — Encodes an ISO-8859-1 string to UTF-8” som klarar att koda om dina data.
enkel psevdokod
öppna databas
läs $post
start:
om postslut gå till avbryt
$utf8_post=utf8_encode($post)
skriv $utf8_post
läs $post
gå till start
avbryt:
stäng databas
troligen finns redan PHP kod som klarar detta annars är det lätt att sno ihop ett väl fungerande program med utgångspunkt från ovanstående psevdokod.
vh Kjell
Hänvisar till KAS/#2 ovan.
Går det dessutom att exportera till någon form av textformat (t.ex. SQL) så är det mycket möjligt att det går att använda iconv för att göra själva konverteringen. På kommandoraden i Linux, om dumpen är i ISO-8859-1 och du vill ha UTF-8:
iconv -f iso-8859-1 -t utf-8 utfil.dump
Förutsatt att inga fel rapporterades kan du sedan importera ”utfil.dump”, som är identisk till innehållet men använder UTF-8 som teckenkodning istället för 8859-1.
gedit klarar också av motsvarande manöver, liksom säkert många andra textredigerare, genom sitt gränssnitt. (I öppna och spara, tvinga den att använda en viss teckenkodning.)
Hoppsan.
Raden som börjar med iconv ska vara:
iconv -f iso-8859-1 -t utf-8 < infil.dump > utfil.dump
Ursäkta.
Som sagt, det borde vara jätteenkelt att skriva ett program som konverterar. Finns säkert på nätet. Här är ungefär som det skulle se ut i Java. Fält och tabeller som ska uppdateras läggs i filen ”table_and_fields.txt”, Typ,
COMMENTTABLE = COMMENTTEXT
COMMENTTABLE = COMM
borttagen kod
System.out.println();
}
con.close();
}
}