Introductie validatie

Om de validatie extra onder de aandacht te brengen is deze pagina gemaakt. Hier is een totaal overzicht van wat op de BlogPagina is verschenen over de html, css en link checks van de afgelopen jaren.

W3Clogo

De validatie service is onderdeel van het W3C consortium, zie hoofdpagina: W3C.

De validatie service informatie pagina: W3C QA Tools:

About W3C QA Tools:
Indispensable for the professional Webmaster, Web Designer or Web Developer, these tools are all free and Open Source.

Quote: The Basics - what you should run on all your web pages.

Het is zinvol om de pagina's van een website te controleren met de

Indien de pagina's zijn goed gekeurd, kan men er van uit gaan dat ze met de verschillende browsers (Firefox, Chrome, Opera, Safari) op de verschillende computers (Linux, Android, Windows, Apple: OS X) goed worden weergegeven.
In september 2011 en november 2011) zijn al html checks uitgevoerd.

Deze checks staan nu ook in het volgende hoofdstuk.

In december 2012 is de CSS stijl gecontroleerd. Bij de controle van de stijl viel het me op, dat de W3C ook een link checker heeft.

Zie november 2012: quote:
Bij het kontroleren van de links in mijn website ontdekte ik, dat de links naar de telefoonboeken (1915 en 1950) niet meer klopten, de documenten zijn 'verhuisd' van domein 'www.de-wit.net' naar 'www.geneaknowhow.net'.
Naar aanleiding van deze wijziging ben ik ook de W3C link checker gaan gebruiken.

Een extra probleem bij html is ook het gebruik van diakritische tekens, met accenten in de namen.
Dit ondervond ik bij het checken van de Aldfaer output van de genealogie pagina's. (november 2011)
De in windows gebruikte character set '1252' gebruikt andere tekens dan de html 'ISO-8859-1' character set.
Een andere complicatie is, dat in Linux het moderne UTF-8 al gebruikelijk is.

Indien de html en de css voldoet aan de html standaard, mogen de logo's van html en css op de webpagina's getoond worden.

HTML validatie (blog september 2011)

Eerste html check (september 2011):

Een eerste check met de 'Google' pagina gaf slechts twee soorten fouten. Een belangrijke fout was het gebruik van een id, waar een class nodig was.

validator

W3C: fout en info melding:

error  Line 71, Column 9: ID "MENU" already defined <div id="menu"><ul class="menu">

info  Line 12, Column 9: ID "MENU" first defined here <div id="menu">

Quote: An "id" is a unique identifier. Each time this attribute is used in a document it must have a different value. If you are using this attribute as a hook for style sheets it may be more appropriate to use classes (which group elements) than id (which are used to identify exactly one element).

Aangepast in style sheet:
was:  #menu { background-color:#dadada; padding:6px;}
wordt: .menu { background-color:#dadada; padding:6px;}

Aangepast in html document:
was:  <div id="menu">
wordt: <div class="menu">


Direct zonder fouten was de pagina FreeBSD, melding na de W3C check: Congratulations:

Quote:
The document located at https://leeuwef.home.xs4all.nl/doc/FreeBSD.html was successfully checked as HTML 4.01 Transitional. This means that the resource in question identified itself as "HTML 4.01 Transitional" and that we successfully performed a formal validation of it. The parser implementations we used for this check are based on OpenSP (SGML/XML).

valid-html401

To show your readers that you have taken the care to create an interoperable Web page, you may display this icon on any page that validates.


W3C Warning melding:

warning  Warning Mismatch between Public and System identifiers in the DOCTYPE declaration.

Quote: This document uses an inconsistent DOCTYPE declaration. The Public Identifier -//W3C//DTD HTML 4.0 Transitional//EN declares the HTML 4.0 Transitional document type, but the associated System Identifier https://www.w3.org/TR/REC-html40/loose.dtd does not match this document type.

The recommended System Identifier for HTML 4.0 Transitional is
https://www.w3.org/TR/1998/REC-html40-19980424/loose.dtd.

De overige pagina's worden nog gecheckt, en eventueel aangepast. Persoonlijk vind ik, dat de verschillende webbrowsers zeer tolerant zijn voor fouten in de html code. Doorgaans check ik met Chrome en Firefox. Het is ook nuttig om af en toe eens InternetExplorer te gebruiken.

In de 'documenten' pagina's bleek, dat de "anker" elementen niet goed waren afgesloten. Het "anker" wordt gebruikt om via een link naar toe te springen.
Ik had in html: <a name="H16081923"> dit moet zijn <a name="H16081923"></a>

Deze fout was me nog niet opgevallen met Chrome en Firefox.

XHTML validatie (blog november 2011)

Tweede xhtml check november 2011:

Nadat in september al een aantal pagina's zijn aangepast aan de W3C standaarden voor html, wordt nu gewerkt aan de genealogie pagina's. Opmerkelijk is, dat hoewel de Aldfaer "export" html is, de code voldoet (bijna!) aan de xhtml standaard, zie de eerste regels van de genealogie pagina:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="https://www.w3.org/1999/xhtml" xml:lang="nl" >
<head>

Door de achtergrond van de pagina's aan te passen, is de genealogie bijna klaar: toegevoegd in de 'style' de 'backgound':
body{ font-family: Verdana, Helvetica, sans-serif; font-size:10pt; background-image: url( image/papier.gif )}

In mei 2010 is ook al aandacht besteed aan xhtml, zie: BlogPagina.

Bij een eerste test met Firefox blijkt nu, dat alleen de speciale (diakritische) tekens in de genealogie nog een foutmelding geven:

XML-parsefout: onjuist gevormd
Locatie: file:///I:/home/doc/genealogie.xhtml
Regelnummer 53, kolom 45:

Hendrik trouwde, ten hoogste 34 jaar oud, vqmqmr 1798 met .....
-------------------------------------------^

Benodigde aanpassingen in de xhtml file:

ó = &oacute; in vóór
é = &eacute; in de naam Miné
ç = &ccedil; in François
ë = &euml; in Nederlands-Indië

Resultaat: Parenteel van Henric van Aanegem.


Een check bij W3C validator zegt:

Valid XHTML 1.0 Transitional

Congratulations:

The document located at
https://leeuwef.home.xs4all.nl/doc/genealogie.xhtml was successfully checked as XHTML 1.0 Strict.

smiley-sad Helaas werkt dit niet goed bij de Internet Explorer . . . . .

Aanbevolen: gebruik Chrome, Firefox of Opera.

Zelfs voor de nieuwe browser in Android is xhtml géén probleem.

Omdat ik in mei 2010 ook al last had met het weergeven van xhtml (met InternetExplorer) vanaf de webserver, zocht ik met Google naar een oplossing.

IBM

Ik vond een uitstekende beschrijving van het probleem en de oplossing op de website van IBM: Tip: Configure Apache to send the right MIME type for HTML.
("Using mod_rewrite browser sniffing")

uit de tekst:

Listing 4. Sending text.html to Internet Explorer

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} .*MSIE.*
RewriteCond %{REQUEST_URI} \.xhtml$
RewriteRule .* - [T=text/html]

Zie ook voorbeeld op de IBM pagina: IBM - Figure 1: Internet Explorer doesn't know what to do with application/xhtml+xml.

smiley-sad In april 2014 ontdekte ik dat de pagina "Configure Apache to send the right MIME type for HTML." van de IBM site verdwenen was, zie: Blog: november 2011

smiley Gelukkig is de pagina wel te vinden op de Internet Archive WayBack Machine.
Zie resultaat: backup IBM artikel

Quote IBM:

In conclusion:
XHTML is the future of the Web. However, like many other important technologies, its adoption has been hampered by poor support in Microsoft browsers.
Quote IBM:
Summary: This tip shows you how to configure Apache to tag Extensible Hypertext Markup Language (XHTML) documents with the media type application/xhtml+xml for browsers that support it, while still sending text/html to non conformant browsers such as Microsoft® Internet Explorer®.

Dit wordt een klusje voor de webmaster van XS4ALL!

smiley-sad Helaas ... de Apache Module "mod_rewrite" is niet geïnstalleerd op de webserver van XS4ALL.
Dat kan beter bij mijn toekomstige FreeBSD webserver!

Bij een controle van mijn website bij de bibliotheek met InternetExplorer 8.0 bleek, dat de namen in de verschillende passagierslijsten (zie: introductie) niet goed worden weergegeven: door IE worden de namen gecentreerd, Chrome, Firefox en Android en Dolphin op de HTC-Flyer tonen de tekst wel goed, links 'uitgelijnd'.
Het probleem wordt veroorzaakt door het <center> html element, om de pagina's van de passagierslijsten in het midden weer te geven. Chrome, Firefox en Android snappen dat dit dan niet voor de inhoud van de tabel met de namen van de passagiers geldt, de InternetExplorer is niet zo slim en voldoet niet aan de web standaarden.

HTML validatie (blog november 2012)

Nadat ik in augustus schreef over MobaXterm voor het aanpassen van diakritische tekens (met accenten) uit Aldfaer heb ik ook de genealogie en documenten pagina's gecontroleerd met de W3C Markup Validation Service (Zie ook september 2011 voor eerste W3C checks).
Het blijkt, dat de tekens met accenten niet het enige probleem zijn: in de verschillende 'documenten' pagina's zaten totaal meer dan 1000 fouten volgens de validation service.

Het is knap van de verschillende browsers, dat ze ondanks de vele fouten nog goede tekst op het scherm toveren!
Een enkele keer ziet men een vraagteken als de browser het niet snapt, zie voorbeeld: question
In de meeste gevallen doet de browser een 'fallback' en interpreteert het een character aan de hand van de Windows-1252 tekens in plaats van de ISO-8859-1.

Zie ook: MS Windows characters in HTML gb

W3C: fout meldingen: in de verschillende pagina's.

error  Line 88, Column 20: there is no attribute 'COLOR'

Tekst: <hr size="2" color="blue">
Opmerking: De meeste browsers geven horizontale lijnen wél goed weer, Opera niet, zie internet color.

Aangepast in style sheet: hr { color:blue; height:2px }
Aangepast in html <hr>

error  Line 428, Column 69: end tag for 'B' omitted, but its declaration does not permit this

Tekst: <center><b><big>In het jaar Negentien Honderd en Vier,</big></center>
Moet zijn: <center><b><big>In het jaar Negentien Honderd en Vier,</big></b></center>

error  Line 560, Column 126: NET-enabling start-tag requires SHORTTAG YES

Tekst: ... class="Notitie">Beroep: dienstbaar<br />opmerking: naam bij huwelijk Leuntje, ...
Opmerking: Aldfaer maakt xhtml, voor html moet <br /> vervangen worden door <br>.
Zie ook blog: november 2011, ook voor het volgende probleem:

error  Line 6101, Column 14: non SGML character number 146

Tekst: en van Antje sqt Hoenderdaal zonder beroep, wonende te Koudekerk

Een quote ´ in html is: &acute;
Opmerking: In dit geval is een single quote gebruikt als accent, eigenlijk moet een apostrof gebruikt worden!

Zie ook in de wikipedia voor een compleet overzicht van Diakritisch tekens en Apostrof.

Er wordt aan gewerkt om zo veel mogelijk de benodigde aanpassingen met een script uit te voeren.
Zie ook tips: MobaXterm voor meer informatie.

Opmerking: De documenten pagina's zullen voorlopig nog geen W3C keurmerk mogen gebruiken.
Voor een goede weergave van de vele akten worden tabellen gebruikt. De validator snapt niet dat in een tabel weer een tabel kan zitten.
Ook geeft de W3C foutmeldingen voor het gebruik van een paragraaf en een lijn (html: <hr> = "horizontal rule" ) in een tabel.

Opmerking: In maart 2021 viel me op, dat ik vaak de "&", ampersand gebruik als onderdeel van de Debian updates of distributie-updates.
Het blijkt in de praktijk, dat het niet nodig is om voor dit teken de officiele html code te gebruiken!
De code voor de ampersand is: zie w3schools: html_entities & =   &amp;  

Voorbeeld website:

top

Om de ampersand code te laten checken door de w3c html checker is even een "test" & toegevoegd: zie:

top

Zowel voor als na de toevoeging van de "test" ampersand bleek dat dit geen probleem was voor de w3c html check!

top

CSS validatie (blog december 2012)

In november 2012 werd de site gecheckt met de css validator.
Nadat in september 2011 (verschillende genealogie en computer pagina's) en november (documenten pagina's met akten) het HTML deel van de website heb laten controleren, is in december de CSS 'style sheet' gecheckt.
De resultaten vielen me mee.


CSS validator De W3C CSS Validator gaf de volgende meldingen:

W3C CSS Validator results for https://leeuwef.home.xs4all.nl/doc/doc.css (CSS level 3)

 Sorry! We found the following errors (2) 

  URI :  https://leeuwef.home.xs4all.nl/doc/doc.css  

  13TABLE,TD,THParse Error font-size:9px
  27AValue Error : padding Parse Error padding=10px

Aangepast in style sheet:
was:  TABLE,TD,TH { font-family:verdana; font-size:9pt; padding 10px }
wordt: TABLE,TD,TH { font-family:verdana; font-size:9pt; padding:10px }

was:  A { verdana font-size:9px; font-weight:normal; }
wordt: A { verdana; font-size:9px; font-weight:normal; }

Resultaat na aanpassingen:

 Gefeliciteerd! Geen fouten gevonden. 

W3Ccss Dit document is gevalideerd als CSS versie 3 !

Om uw lezers te laten zien dat u de moeite heeft genomen om een interoperabele webpagina te maken, kunt u dit pictogram op elke gevalideerde pagina plaatsen.


Twee probleempjes met de nieuwe style sheet waren, dat in de KwartierstaatTabel pagina nu:

De letter grootte onder in de tabel is: <font size="4"> ... tekst ... </font>
Door de regel A { verdana; font-size:9px; font-weight: normal; } worden de links met kleine letters weergegeven.
De regel is nu weggelaten uit de style sheet! Ook de tekst padding:10px is nu weggelaten.

Links validatie

validator

Zie november 2012: quote:
Bij het controleren van de links in mijn website ontdekte ik, dat de links naar de telefoonboeken (1915 en 1950) niet meer klopten, de documenten zijn 'verhuisd' van domein 'www.de-wit.net' naar 'www.geneaknowhow.net'

Recent kontroleerde ik ook de link: http://users.skynet.be/gentools/kalenders.htm: kalender voor een Republikeinse datum omreken programma.
De site gaf een melding: quote: U wordt binnen 10 sec. doorgestuurd naar onze nieuwe website. Pas uw bookmarks aan.
De nieuw pagina is: gentools kalenders.

Naar aanleiding van deze wijzigingen ben ik ook de W3C link checker gaan gebruiken.

Het kontroleren van de links duurt flink wat langer dan een html of een css check.


Check:

Processing https://leeuwef.home.xs4all.nl/doc/InternetBronnen.html

Settings used:

Opmerking: For reliable link checking results, check HTML validity and CSS validity first.

Status: Done.
Document processed in 80.15 seconds.

Parsing...
done (519 lines in 0.05 seconds).
Checking anchors...
done.

Hierna komen veel informatie meldingen, voorbeelden:
Checking link https://leeuwef.home.xs4all.nl/doc/geschiedenis.html
GET https://leeuwef.home.xs4all.nl/doc/geschiedenis.html  fetched in 0.25 seconds
Parsing...
 done (754 lines in 0.03 seconds).
Checking link https://www.archief.delft.nl/
HEAD http://www.archief.delft.nl/  fetched in 1.59 seconds
Checking link http://www.gahetna.nl/
HEAD http://www.gahetna.nl/
-> HEAD http://m.gahetna.nl  fetched in 1.43 seconds
Checking link https://nl.wikipedia.org/wiki/Microfilm
HEAD https://nl.wikipedia.org/wiki/Microfilm  fetched in 2.26 seconds
Checking link https://www.familysearch.org/
HEAD https://www.familysearch.org/  fetched in 1.34 seconds

List of redirects

Quote:
The links below are not broken, but the document does not use the exact URL, and the links were redirected.
It may be a good idea to link to the final location, for the sake of speed.

Line: 469 http://www.familysearch.org/eng/ redirected to https://familysearch.org/ Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.
Line: 512 http://www.militieregisters.nl/ redirected to http://militieregisters.nl/ Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.

De bovenstaande melding "This is a permanent redirect. The link should be updated." is natuurlijk van belang, aanpassen!

Anchors

Found 12 anchors.
Valid anchors!
Checked 1 document in 80.24 seconds.


Check:

Processing https://leeuwef.home.xs4all.nl/doc/onderzoek.html

Status: Done.
Document processed in 296.94 seconds.

Een paar foutmeldingen:

Results
List of broken links and other issues

There are issues with the URLs listed below. The table summarizes the issues and suggested actions by HTTP response status code.

Code
Occurrences
What to do
(N/A)
3
The link was not checked due to robots exclusion rules.
Check the link manually, and see also the link checker documentation on robots exclusion.
(N/A)
1
The hostname could not be resolved. Check the link for typos.
200
10
Some of the links to this resource point to broken URI fragments (such as index.html#fragment).
404
6
The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting.
If the link points to a resource that no longer exists, you may want to remove or fix the link.
500
2
This is a server side problem. Check the URI.

Fout:
Lines: 1135, 1145 https://leeuwef.home.xs4all.nl/doc/doc/KwartierstaatTabel.html
Status: 404 Not Found
The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting.
If the link points to a resource that no longer exists, you may want to remove or fix the link.

Oplossing:
doc/ moet verwijderd worden! (foutje met kopie-en-plak aktie!)

Info:
Lines: 169, 955 http://www.ancestors.nl/
Status: (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.

Waarschuwing:
Lines: 486, 997 https://www.archieven.nl/ redirected to https://www.archieven.nl/nl/
Status: 303 -> 200 OK

Anchors
Found 68 anchors.
List of duplicate and empty anchors

Anchor
Lines
februari2012
1058, 1086
juli2010
705, 712

Checked 1 document in 297.02 seconds.


Opmerking: de links naar Genlias moeten ook aangepast worden, de nieuwe site is: WieWasWie [januari 2013]

Zie BlogPagina november 2015 recente wijzigingen:

Een nieuw fenomeen bij de link check was: "Status: 405 Method Not Allowed".
Overigens werkt de link wel! ... nader onderzoek nodig!

Een eerste check: https://leeuwef.home.xs4all.nl/doc/BlogPagina.html

Enkele fouten, info en warning meldingen:

error  Line 936: https://leeuwef.home.xs4all.nl/doc/tips Status: 404 Not Found

Tekst: https://leeuwef.home.xs4all.nl/doc/tips
Moet zijn: https://leeuwef.home.xs4all.nl/doc/tips.html

error  Lines: 30, 405, 598, 1066: https://leeuwef.home.xs4all.nl/doc/BlogPagina.html Status: 200 OK
Some of the links to this resource point to broken URI fragments (such as index.html#fragment).
Broken fragments: Moet zijn:

info  Line: 859, Column 9: http://htcdev.com/bootloader/ Status: (N/A) Forbidden by robots.txt
Info: The link was not checked due to robots exclusion rules. Check the link manually.

warning  Lines: 44, 51 https://www.youtube.com/googlechrome redirected to https://www.youtube.com/user/googlechrome Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated to point to the more recent URI.

warning  Line: 571 http://www.theregister.co.uk/2011/10/06/banking_trojan_steals_sms/ Status: 405 Method Not Allowed
The server does not allow HTTP HEAD requests, which prevents the Link Checker to check the link automatically. Check the link manually.

Andere mogelijke meldingen die ik tijdens checks vond:

error  Line: ... https://www.abisource.com/
Status: 500  Can't connect to www.abisource.com:443 (certificate verify failed)

This is a server side problem. Check the URI.    [03-2021]

Aldfaer

Voor de genealogie gebruik ik Aldfaer. Als rapport kunnen parentelen, kwartierstaaten en persoonskaarten gemaakt worden. De rapporten exporteren html, hoewel in de header staat dat het een xhtml document is!

Een probleem is, om de accenten in de namen om te zetten naar html code.
Het aanpassen van de namen in het rapport uit Aldfaer eerste check met uitvoeren met MobaXterm, zie: BlogPagina augustus 2012 en: Tips MobaXterm.

Speciale aandacht is nodig voor de quote: " is in html: &quot;
In de html van Aldfaer komt de " veel voor in het rapport.
Het is van belang dat deze " niet wordt aangepast. Het beste is om in de tekst bij Aldfaer alleen een single quote te gebruiken.

De parentelen en kwartierstaaten kunnen het beste in een subdirectory bewerkt worden met een Perl script voor de benodigde aanpassingen.
Zie ook: BlogPagina juli 2015: MobaXterm: script, http naar https

werk

In juli 2020 controleerde ik de genealogie pagina's met de html checker.
Bij de 'van Leeuwen' parenteel was er een fout in een naam:

W3C-html

Opmerkelijk: de html checker geeft geen foutmelding bij de naam "hélène"

Bij de parenteel 'van der Horst' was er een fout met de plaatsnaam:

W3C-html

Het blijkt, dat de plaats 's-Gravenhage in de meeste gevallen met een losse 'apostrof' en een s zijn gespeld.
In bovenstaande geval was de apostrof gekoppeld aan de s.

Ook een link check is aan te bevelen!

Resultaten:

W3C: fout en info melding:

error  Line 1899: http://www.wiewaswie.nl/ redirected to https://www.wiewaswie.nl/
Status: 301 -> 403 Forbidden: Access is denied.
The link is forbidden! This needs fixing. Usual suspects: a missing index.html or Overview.html, or a missing ACL.

info  Line 1897 http://denhaag.digitalestamboom.nl/
Status: (N/A) Checking non-public IP address disallowed by link checker configuration
...Check the link manually, in particular its hostname/IP address
De digitale stamboom is verhuisd naar: Haags Gemeentearchief

info  Line 1901 http://www.samh.nl/ redirected to https://www.samh.nl/
Status: 301 -> (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.

info  Line 1900 http://www.groenehartarchieven.nl/ redirected to https://www.groenehartarchieven.nl/
Status: 301 -$gt> (N/A) Forbidden by robots.txt
The link was not checked due to robots exclusion rules. Check the link manually.

List of redirects

warning  Line 1900 http://www.streekarchiefrijnlandsmidden.nl/ redirected to https://gemeentearchief.alphenaandenrijn.nl/
Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.

warning  Line 24 http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ redirected to https://creativecommons.org/licenses/by-nc-sa/3.0/nl/
Status: 301 -> 200 OK
This is a permanent redirect. The link should be updated.

W3Ccss W3Chtml Wordt vervolgd ... werk in uitvoering!

top