Om de validatie extra onder de aandacht te brengen is deze pagina gemaakt. Hier is een totaal overzicht van wat op de BlogPagina is verschenen over de html, css en link checks van de afgelopen jaren.
De validatie service is onderdeel van het W3C consortium, zie hoofdpagina: W3C.
De validatie service informatie pagina: W3C QA Tools:
About W3C QA Tools:
Indispensable for the professional Webmaster, Web Designer or Web Developer, these tools are all free and Open Source.
Quote: The Basics - what you should run on all your web pages.
Het is zinvol om de pagina's van een website te controleren met deIndien de pagina's zijn goed gekeurd, kan men er van uit gaan dat ze met de verschillende browsers (Firefox, Chrome, Opera, Safari) op de
verschillende computers (Linux, Android, Windows, Apple: OS X) goed worden weergegeven.
In september 2011 en november 2011) zijn al html checks uitgevoerd.
Deze checks staan nu ook in het volgende hoofdstuk.
In december 2012 is de CSS stijl gecontroleerd. Bij de controle van de stijl viel het me op, dat de W3C ook een link checker heeft.
Zie november 2012: quote:
Bij het kontroleren van de links in mijn website ontdekte ik, dat de links naar de telefoonboeken (1915 en 1950) niet meer klopten,
de documenten zijn 'verhuisd' van domein 'www.de-wit.net' naar 'www.geneaknowhow.net'.
Naar aanleiding van deze wijziging ben ik ook de W3C link checker gaan gebruiken.
Een extra probleem bij html is ook het gebruik van diakritische tekens, met accenten in de namen.
Dit ondervond ik bij het checken van de Aldfaer output van de genealogie pagina's. (november 2011)
De in windows gebruikte character set '1252' gebruikt andere tekens dan de html 'ISO-8859-1' character set.
Een andere complicatie is, dat in Linux het moderne UTF-8 al gebruikelijk is.
Indien de html en de css voldoet aan de html standaard, mogen de logo's van html en css op de webpagina's getoond worden.
Eerste html check (september 2011):
Een eerste check met de 'Google' pagina gaf slechts twee soorten fouten. Een belangrijke fout was het gebruik van een id, waar een class nodig was.
W3C: fout en info melding:
Line 71, Column 9: ID "MENU" already defined <div id="menu"><ul class="menu">
Line 12, Column 9: ID "MENU" first defined here <div id="menu">
Quote: An "id" is a unique identifier. Each time this attribute is used in a document it must have a different value. If you are using this attribute as a hook for style sheets it may be more appropriate to use classes (which group elements) than id (which are used to identify exactly one element).
Aangepast in style sheet:
was: #menu { background-color:#dadada; padding:6px;}
wordt: .menu { background-color:#dadada; padding:6px;}
Aangepast in html document:
was: <div id="menu">
wordt: <div class="menu">
Direct zonder fouten was de pagina FreeBSD, melding na de W3C check: Congratulations:
Quote:
The document located at https://leeuwef.home.xs4all.nl/doc/FreeBSD.html was successfully checked as HTML 4.01 Transitional.
This means that the resource in question identified itself as "HTML 4.01 Transitional" and that we successfully performed a formal validation of it.
The parser implementations we used for this check are based on OpenSP (SGML/XML).
To show your readers that you have taken the care to create an interoperable Web page, you may display this icon on any page that validates.
W3C Warning melding:
Warning Mismatch between Public and System identifiers in the DOCTYPE declaration.
Quote: This document uses an inconsistent DOCTYPE declaration. The Public Identifier -//W3C//DTD HTML 4.0 Transitional//EN declares the HTML 4.0 Transitional document type, but the associated System Identifier https://www.w3.org/TR/REC-html40/loose.dtd does not match this document type.
The recommended System Identifier for HTML 4.0 Transitional is
https://www.w3.org/TR/1998/REC-html40-19980424/loose.dtd.
Deze fout was me nog niet opgevallen met Chrome en Firefox.
Tweede xhtml check november 2011:
Nadat in september al een aantal pagina's zijn aangepast aan de W3C standaarden voor html, wordt nu gewerkt aan de genealogie pagina's. Opmerkelijk is, dat hoewel de Aldfaer "export" html is, de code voldoet (bijna!) aan de xhtml standaard, zie de eerste regels van de genealogie pagina:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="https://www.w3.org/1999/xhtml" xml:lang="nl" > <head>Door de achtergrond van de pagina's aan te passen, is de genealogie bijna klaar: toegevoegd in de 'style' de 'backgound':
body{ font-family: Verdana, Helvetica, sans-serif; font-size:10pt; background-image: url( image/papier.gif )}
In mei 2010 is ook al aandacht besteed aan xhtml, zie: BlogPagina.
Bij een eerste test met Firefox blijkt nu, dat alleen de speciale (diakritische) tekens in de genealogie nog een foutmelding geven:
XML-parsefout: onjuist gevormd
Locatie: file:///I:/home/doc/genealogie.xhtml
Regelnummer 53, kolom 45:
Hendrik trouwde, ten hoogste 34 jaar oud, vr 1798 met ..... -------------------------------------------^
Benodigde aanpassingen in de xhtml file:
ó = ó in vóór
é = é in de naam Miné
ç = ç in François
ë = ë in Nederlands-Indië
Resultaat: Parenteel van Henric van Aanegem.
Een check bij W3C validator zegt:
Congratulations:
The document located at
https://leeuwef.home.xs4all.nl/doc/genealogie.xhtml
was successfully checked as XHTML 1.0 Strict.
Aanbevolen: gebruik Chrome, Firefox of Opera.
Zelfs voor de nieuwe browser in Android is xhtml géén probleem.
Omdat ik in mei 2010 ook al last had met het weergeven van xhtml (met InternetExplorer) vanaf de webserver, zocht ik met Google naar een oplossing.
Ik vond een uitstekende beschrijving van het probleem en de oplossing op de website van IBM:
Tip: Configure Apache to send the right MIME type for HTML.
("Using mod_rewrite browser sniffing")
uit de tekst:
Listing 4. Sending text.html to Internet Explorer
RewriteEngine on RewriteCond %{HTTP_USER_AGENT} .*MSIE.* RewriteCond %{REQUEST_URI} \.xhtml$ RewriteRule .* - [T=text/html]
Zie ook voorbeeld op de IBM pagina: IBM - Figure 1: Internet Explorer doesn't know what to do with application/xhtml+xml.
Gelukkig is de pagina wel te vinden op de Internet Archive WayBack Machine.
Zie resultaat: backup IBM artikel
Quote IBM:
In conclusion:Quote IBM:
XHTML is the future of the Web. However, like many other important technologies, its adoption has been hampered by poor support in Microsoft browsers.
Summary: This tip shows you how to configure Apache to tag Extensible Hypertext Markup Language (XHTML) documents with the media type application/xhtml+xml for browsers that support it, while still sending text/html to non conformant browsers such as Microsoft® Internet Explorer®.
Dit wordt een klusje voor de webmaster van XS4ALL!
Bij een controle van mijn website bij de bibliotheek met InternetExplorer 8.0 bleek, dat de namen in de verschillende passagierslijsten (zie:
introductie) niet goed worden weergegeven: door IE worden de namen gecentreerd,
Chrome, Firefox en Android en Dolphin op de HTC-Flyer tonen de tekst wel goed, links 'uitgelijnd'.
Het probleem wordt veroorzaakt door het <center> html element, om de pagina's van de passagierslijsten in het midden weer te geven.
Chrome, Firefox en Android snappen dat dit dan niet voor de inhoud van de tabel met de namen van de passagiers geldt,
de InternetExplorer is niet zo slim en voldoet niet aan de web standaarden.
Nadat ik in augustus schreef over MobaXterm voor het aanpassen van diakritische tekens (met accenten) uit
Aldfaer heb ik ook de genealogie en documenten pagina's gecontroleerd met de
W3C Markup Validation Service
(Zie ook september 2011 voor eerste W3C checks).
Het blijkt, dat de tekens met accenten niet het enige probleem zijn: in de verschillende 'documenten' pagina's zaten totaal meer dan
1000 fouten volgens de validation service.
Het is knap van de verschillende browsers, dat ze ondanks de vele fouten nog goede tekst op het scherm toveren!
Een enkele keer ziet men een vraagteken als de browser het niet snapt, zie voorbeeld:
In de meeste gevallen doet de browser een 'fallback' en interpreteert het een character aan de hand van de Windows-1252 tekens in plaats van de ISO-8859-1.
Zie ook: MS Windows characters in HTML
W3C: fout meldingen: in de verschillende pagina's.
Line 88, Column 20: there is no attribute 'COLOR'
Tekst: <hr size="2" color="blue">
Opmerking: De meeste browsers geven horizontale lijnen wél goed weer, Opera niet, zie internet color.
Aangepast in style sheet: hr { color:blue; height:2px }
Aangepast in html <hr>
Line 428, Column 69: end tag for 'B' omitted, but its declaration does not permit this
Tekst: <center><b><big>In het jaar Negentien Honderd en Vier,</big></center>
Moet zijn: <center><b><big>In het jaar Negentien Honderd en Vier,</big></b></center>
Line 560, Column 126: NET-enabling start-tag requires SHORTTAG YES
Tekst: ... class="Notitie">Beroep: dienstbaar<br />opmerking: naam bij huwelijk Leuntje, ...
Opmerking: Aldfaer maakt xhtml, voor html moet <br /> vervangen worden door <br>.
Zie ook blog: november 2011, ook voor het volgende probleem:
Line 6101, Column 14: non SGML character number 146
Tekst: en van Antje t Hoenderdaal zonder beroep, wonende te Koudekerk
Een quote ´ in html is: ´
Opmerking: In dit geval is een single quote gebruikt als accent, eigenlijk moet een apostrof gebruikt worden!
Zie ook in de wikipedia voor een compleet overzicht van Diakritisch tekens en Apostrof.
Er wordt aan gewerkt om zo veel mogelijk de benodigde aanpassingen met een script uit te voeren.
Zie ook tips: MobaXterm voor meer informatie.
Opmerking: De documenten pagina's zullen voorlopig nog geen W3C keurmerk mogen gebruiken.
Voor een goede weergave van de vele akten worden tabellen gebruikt. De validator snapt niet dat in een tabel weer een tabel kan zitten.
Ook geeft de W3C foutmeldingen voor het gebruik van een paragraaf en een lijn (html: <hr> = "horizontal rule" ) in een tabel.
Opmerking: In maart 2021 viel me op, dat ik vaak de "&", ampersand gebruik als onderdeel van de Debian updates of distributie-updates.
Het blijkt in de praktijk, dat het niet nodig is om voor dit teken de officiele html code te gebruiken!
De code voor de ampersand is: zie w3schools: html_entities
& = &
Voorbeeld website:
Om de ampersand code te laten checken door de w3c html checker is even een "test" & toegevoegd: zie:
Zowel voor als na de toevoeging van de "test" ampersand bleek dat dit geen probleem was voor de w3c html check!
In november 2012 werd de site gecheckt met de css validator.
Nadat in september 2011 (verschillende genealogie en computer pagina's) en
november (documenten pagina's met akten) het HTML deel van de website heb laten controleren, is in december de CSS 'style sheet' gecheckt.
De resultaten vielen me mee.
13 | TABLE,TD,TH | Parse Error font-size:9px |
---|---|---|
27 | A | Value Error : padding Parse Error padding=10px |
Aangepast in style sheet:
was: TABLE,TD,TH { font-family:verdana; font-size:9pt; padding 10px }
wordt: TABLE,TD,TH { font-family:verdana; font-size:9pt; padding:10px }
was: A { verdana font-size:9px; font-weight:normal; }
wordt: A { verdana; font-size:9px; font-weight:normal; }
Resultaat na aanpassingen:
Gefeliciteerd! Geen fouten gevonden.
Dit document is gevalideerd als CSS versie 3 !
Om uw lezers te laten zien dat u de moeite heeft genomen om een interoperabele webpagina te maken, kunt u dit pictogram op elke gevalideerde pagina plaatsen.
De letter grootte onder in de tabel is: <font size="4"> ... tekst ... </font>
Door de regel A { verdana; font-size:9px; font-weight: normal; } worden de links met kleine letters weergegeven.
De regel is nu weggelaten uit de style sheet!
Ook de tekst padding:10px is nu weggelaten.
Zie november 2012: quote:
Bij het controleren van de links in mijn website ontdekte ik, dat de links naar de telefoonboeken (1915 en 1950) niet meer klopten,
de documenten zijn 'verhuisd' van domein 'www.de-wit.net' naar 'www.geneaknowhow.net'
Recent kontroleerde ik ook de link: http://users.skynet.be/gentools/kalenders.htm: kalender voor een Republikeinse datum
omreken programma.
De site gaf een melding: quote: U wordt binnen 10 sec. doorgestuurd naar onze nieuwe website. Pas uw bookmarks aan.
De nieuw pagina is: gentools kalenders.
Het kontroleren van de links duurt flink wat langer dan een html of een css check.
Check:
Processing https://leeuwef.home.xs4all.nl/doc/InternetBronnen.html
Settings used:Opmerking: For reliable link checking results, check HTML validity and CSS validity first.
Status: Done.
Document processed in 80.15 seconds.
Parsing...
done (519 lines in 0.05 seconds).
Checking anchors...
done.
Checking link https://leeuwef.home.xs4all.nl/doc/geschiedenis.html GET https://leeuwef.home.xs4all.nl/doc/geschiedenis.html fetched in 0.25 seconds Parsing... done (754 lines in 0.03 seconds).
Checking link https://www.archief.delft.nl/ HEAD http://www.archief.delft.nl/ fetched in 1.59 seconds
Checking link http://www.gahetna.nl/ HEAD http://www.gahetna.nl/ -> HEAD http://m.gahetna.nl fetched in 1.43 seconds
Checking link https://nl.wikipedia.org/wiki/Microfilm HEAD https://nl.wikipedia.org/wiki/Microfilm fetched in 2.26 seconds
Checking link https://www.familysearch.org/ HEAD https://www.familysearch.org/ fetched in 1.34 seconds
List of redirects
Quote:
The links below are not broken, but the document does not use the exact URL, and the links were redirected.
It may be a good idea to link to the final location, for the sake of speed.
Line: 469 http://www.familysearch.org/eng/ redirected to https://familysearch.org/ Status: 301 -> 200 OK This is a permanent redirect. The link should be updated.
Line: 512 http://www.militieregisters.nl/ redirected to http://militieregisters.nl/ Status: 301 -> 200 OK This is a permanent redirect. The link should be updated.
De bovenstaande melding "This is a permanent redirect. The link should be updated." is natuurlijk van belang, aanpassen!
Anchors
Found 12 anchors.
Valid anchors!
Checked 1 document in 80.24 seconds.
Check:
Processing https://leeuwef.home.xs4all.nl/doc/onderzoek.html
Status: Done.
Document processed in 296.94 seconds.
Een paar foutmeldingen:
Results
List of broken links and other issues
There are issues with the URLs listed below. The table summarizes the issues and suggested actions by HTTP response status code.
| ||
The link was not checked due to robots exclusion rules. Check the link manually, and see also the link checker documentation on robots exclusion. | ||
The hostname could not be resolved. Check the link for typos. | ||
Some of the links to this resource point to broken URI fragments (such as index.html#fragment). | ||
The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting. If the link points to a resource that no longer exists, you may want to remove or fix the link. | ||
This is a server side problem. Check the URI. |
Fout:
Lines: 1135, 1145 https://leeuwef.home.xs4all.nl/doc/doc/KwartierstaatTabel.html
Status: 404 Not Found
The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting.
If the link points to a resource that no longer exists, you may want to remove or fix the link.
Oplossing:
doc/ moet verwijderd worden! (foutje met kopie-en-plak aktie!)
Info:
Lines: 169, 955 http://www.ancestors.nl/
Status: (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.
Waarschuwing:
Lines: 486, 997 https://www.archieven.nl/ redirected to https://www.archieven.nl/nl/
Status: 303 -> 200 OK
Anchors
Found 68 anchors.
List of duplicate and empty anchors
Checked 1 document in 297.02 seconds.
Een nieuw fenomeen bij de link check was: "Status: 405 Method Not Allowed".
Overigens werkt de link wel! ... nader onderzoek nodig!
Een eerste check: https://leeuwef.home.xs4all.nl/doc/BlogPagina.html
Enkele fouten, info en warning meldingen: Line 936: https://leeuwef.home.xs4all.nl/doc/tips Status: 404 Not FoundTekst: https://leeuwef.home.xs4all.nl/doc/tipsLines: 30, 405, 598, 1066: https://leeuwef.home.xs4all.nl/doc/BlogPagina.html Status: 200 OK
Moet zijn: https://leeuwef.home.xs4all.nl/doc/tips.html
Some of the links to this resource point to broken URI fragments (such as index.html#fragment).Line: 859, Column 9: http://htcdev.com/bootloader/ Status: (N/A) Forbidden by robots.txt
Broken fragments:Moet zijn:
- https://leeuwef.home.xs4all.nl/doc/BlogPagina.html#mei2010 (line 598)
- https://leeuwef.home.xs4all.nl/doc/BlogPagina.html#februari2010 (line 405)
- https://leeuwef.home.xs4all.nl/doc/BlogPaginaA.html#mei2010
- https://leeuwef.home.xs4all.nl/doc/BlogPaginaA.html#februari2010
Info: The link was not checked due to robots exclusion rules. Check the link manually.Lines: 44, 51 https://www.youtube.com/googlechrome redirected to https://www.youtube.com/user/googlechrome Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated to point to the more recent URI.Line: 571 http://www.theregister.co.uk/2011/10/06/banking_trojan_steals_sms/ Status: 405 Method Not Allowed
The server does not allow HTTP HEAD requests, which prevents the Link Checker to check the link automatically. Check the link manually.
Andere mogelijke meldingen die ik tijdens checks vond:
Line: ... https://www.abisource.com/Status: 500 Can't connect to www.abisource.com:443 (certificate verify failed)This is a server side problem. Check the URI. [03-2021]
Voor de genealogie gebruik ik Aldfaer. Als rapport kunnen parentelen, kwartierstaaten en persoonskaarten gemaakt worden. De rapporten exporteren html, hoewel in de header staat dat het een xhtml document is!
Een probleem is, om de accenten in de namen om te zetten naar html code.
Het aanpassen van de namen in het rapport uit Aldfaer eerste check met uitvoeren met MobaXterm, zie:
BlogPagina augustus 2012 en: Tips MobaXterm.
Speciale aandacht is nodig voor de quote: " is in html: "
In de html van Aldfaer komt de " veel voor in het rapport.
Het is van belang dat deze " niet wordt aangepast. Het beste is om in de tekst bij Aldfaer alleen een single quote te gebruiken.
De parentelen en kwartierstaaten kunnen het beste in een subdirectory bewerkt worden met een Perl script voor de benodigde aanpassingen.
Zie ook: BlogPagina juli 2015: MobaXterm: script, http naar https
In juli 2020 controleerde ik de genealogie pagina's met de html checker.
Bij de 'van Leeuwen' parenteel was er een fout in een naam:
Opmerkelijk: de html checker geeft geen foutmelding bij de naam "hélène"
Bij de parenteel 'van der Horst' was er een fout met de plaatsnaam:
Het blijkt, dat de plaats 's-Gravenhage in de meeste gevallen met een losse 'apostrof' en een s zijn gespeld.
In bovenstaande geval was de apostrof gekoppeld aan de s.
Ook een link check is aan te bevelen!
Resultaten:
W3C: fout en info melding:
Line 1899: http://www.wiewaswie.nl/ redirected to https://www.wiewaswie.nl/
Status: 301 -> 403 Forbidden: Access is denied.
The link is forbidden! This needs fixing. Usual suspects: a missing index.html or Overview.html, or a missing ACL.
Line 1897 http://denhaag.digitalestamboom.nl/
Status: (N/A) Checking non-public IP address disallowed by link checker configuration
...Check the link manually, in particular its hostname/IP address
De digitale stamboom is verhuisd naar: Haags Gemeentearchief
Line 1901 http://www.samh.nl/ redirected to https://www.samh.nl/
Status: 301 -> (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.
Line 1900 http://www.groenehartarchieven.nl/ redirected to https://www.groenehartarchieven.nl/
Status: 301 -$gt> (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.
List of redirects
Line 1900 http://www.streekarchiefrijnlandsmidden.nl/ redirected to https://gemeentearchief.alphenaandenrijn.nl/
Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.
Line 24 http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ redirected to https://creativecommons.org/licenses/by-nc-sa/3.0/nl/
Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.
Wordt vervolgd ... werk in uitvoering!