Benchmarken: afrekenen of leren?

20 februari 2013 om 16:50 door Henk Klaassen 0 reacties

In de private sector is al een lange traditie van benchmarking. Maar in de publieke sector is, in vergelijking met de private, duidelijk sprake van een achterstand. Pas in de afgelopen tien jaar

In de private sector is al een lange traditie van benchmarking. Maar in de publieke sector is, in vergelijking met de private, duidelijk sprake van een achterstand. Pas in de afgelopen tien jaar is benchmarking binnen overheden een gebezigde term geworden en zijn ervaringen met het instrument opgedaan. In dit artikel gaat de auteur op zoek naar een zinvol gebruik van het instrument benchmarking in de publieke sector.

Benchmarking heeft in de West- Europese landen een hoge vlucht genomen. Er is al een lange traditie van benchmarking in de private sector waarbij het in het begin vooral ging om inzicht in de doelmatigheid en doeltreffendheid van het voortbrengingsproces van goederen en diensten. Later komen in die sector ook aspectgerichte benchmarks in zwang die een minder directe relatie met het doelmatigheidsvraagstuk bezitten en meer gericht zijn op verbetering van bijvoorbeeld ondersteunende activiteiten of het imago van de organisatie. In de publieke sector echter is benchmarking binnen overheden pas in de afgelopen tien jaar een gebezigde term geworden en zijn ervaringen met het instrument opgedaan.

Benchmarking in de publieke sector is duidelijk gecompliceerder dan in de private sector. Dit hangt samen met het in de publieke sector explicieter aanwezig zijn van waardencomplexiteit dan in de private sector (Hakvoort en Klaassen, 2004). Waardencomplexiteit verwijst naar de aanwezigheid van verschillende met elkaar concurrerende waarden zoals het streven naar efficiëntie, klantgerichtheid, rechtsgelijkheid en democratisch handelen. Zo kan bijvoorbeeld een vergelijking van kostenprofielen van burgerzaken van gemeenten mogelijke inefficiënties op het terrein van gemeentelijke dienstverlening aan het licht brengen, maar deze informatie zal over het algemeen onvoldoende zijn om alleen op grond daarvan maatregelen te treffen.

Immers, het kan bijvoorbeeld zeer goed mogelijk zijn dat juist in de gemeenten met lage kosten, toch de laagste klantvriendelijkheid bestaat. Het ontwerp van een benchmark in de publieke sector vereist in dit opzicht dus meer zorgvuldigheid bij het ontwerp en interpretatie dan de tegenhanger in de private sector.

Onderzoek naar benchmarken in verschillende settingen is bijna noodzakelijkerwijs kwalitatief en produceert zelden generieke uitspraken. Dat het desondanks belangrijk is er aandacht aan te besteden, is dat het – uitgaande van een meer heuristisch perspectief – inzichten kan opleveren die van nut zijn bij het ontwerpen van benchmarkinitiatieven die beter doorwerken.

De vraag die centraal staat in dit artikel luidt: In hoeverre is het verknopen van het instrument benchmarking met bekostiging van invloed op de acceptatie van de uitkomsten en welke overige factoren zijn bepalend voor gedragsreacties van partijen die deel uitmaken van een benchmark? Deze vraag wordt als volgt uitgewerkt. Allereerst wordt kort stilgestaan bij het begrip benchmarken. Het begrip is sterk aan inflatie onderhevig. Alle vergelijkingen die in het openbaar bestuur worden gemaakt heten tegenwoordig benchmarking. Dit maakt het toepassen wel makkelijker, maar wordt daarmee ook steeds betekenislozer. In paragraaf 2 is het begrip nader geduid en afgebakend. Mogelijke gedragsreacties op resultaten van benchmarkstudies zijn in paragraaf 3 uitgewerkt. In de afsluitende paragraaf zijn enkele lijnen bij elkaar gebracht en zijn conclusies getrokken.

Benchmarking meer dan vergelijken?
Het American Productivity & Quality Center (APQC) stelt “Benchmarking is een voortdurend en systematisch meetproces; een proces van voortdurend meten en vergelijken van het bedrijfsproces van een organisatie ten opzichte van de beste in dat proces waar ook ter wereld, om daardoor informatie te verkrijgen die de organisatie zal helpen initiatieven te nemen om haar prestatie te verbeteren” (geciteerd uit Watson, p.14). Deze – typisch uit de management literatuur afkomstige en op het bedrijfsleven geënte – omschrijving benadrukt het excellent willen zijn, het zich spiegelen aan de best practice. Veelal worden verschillende aspecten van het bedrijfsproces in ogenschouw genomen, zoals markten, klanten, producten en processen. Op operationeel niveau (operationele benchmarking) resulteren dan oordelen over productpositionering, behandelen van klachten van klanten, analyse van producten van concurrenten. Op strategisch niveau (strategische benchmarking) zijn er oordelen over concurrentiekracht en mate van klanttevredenheid. Wat betreft toepassing kan worden geconstateerd dat het domein van benchmarking in de private sector zich in de loop van de tijd heeft verbreed. Behalve de typische gerichtheid op het product, en dan vooral de wijze waarop het wordt voortgebracht en vermarkt, bestaan er nu ook toepassingen op andere, niet direct productgerelateerde toepassingen, bijvoorbeeld over het leervermogen of human resource aspecten.

De populariteit van benchmarken in de private sector is overgeslagen naar de publieke sector. Al meer dan tien jaar verschijnen met regelmaat benchmarkstudies. Zoals in paragraaf 1 gesteld is de expliciete aanwezigheid van verschillende waarden waarmee in de publieke sector rekening gehouden moet worden, een complicerende factor. Uiteraard is het in technisch opzicht mogelijk efficiencyberekeningen te maken t.a.v. de voortbrenging van diensten (bijvoorbeeld diverse benchmarkonderzoeken in de gezondheidszorg (zie o.a. Blank, 1999)). Dergelijke berekeningen zijn zuivere vormen van benchmarking en kunnen op zich bijdragen in het verkrijgen van inzichten in besteding van (publieke) middelen.1 Complicerende factor is dat deze informatie op zich onvoldoende is om tot een (her)allocatie van middelen te komen. Niet-financiële aspecten (waarden) als toegankelijkheid, bejegening en behandeling en transparantie kunnen niet in deze berekeningen worden opgenomen. Ze kunnen er hoogstens naast worden geplaatst. Het zou in dit verband duidelijker zijn om in die situatie te spreken van systematische vergelijking van de performance van organisaties in plaats van benchmarking. Internationaal is de inflatie van het begrip benchmarking echter zo ver voortgeschreden, dat elke systematische vergelijking van kengetallen van organisaties benchmarking wordt genoemd. In dit artikel wordt ook bij deze brede opvatting aangesloten.

Naast het expliciet(er) voorkomen van waardencomplexiteit in de publieke sector, bestaat er nog een ander – wellicht principiëler – verschil tussen benchmarking in de publieke sector en benchmarking in de private sector. In de private sector gaat het in veel gevallen over autonome eenheden (organisaties) die zelfstandig over koers (strategie) en inzet van productiefactoren kunnen beslissen. Men zou deze situatie kunnen omschrijven als een optimaliseringsvraagstuk waarbij de middelen die ingezet kunnen worden constant zijn. In de publieke sector is vrijwel altijd sprake van een principaal – agent relatie. Dit impliceert dat de middelen toegewezen aan een organisatie aangewend moeten worden voor de taken en activiteiten zoals vastgesteld. De ter beschikking staande middelen zijn echter geen constante, met andere woorden het is een optimaliseringsvraagstuk waarbij de middelen in (zekere) mate afhankelijk zijn van de gestelde eisen. Dit kan betekenen dat bij een organisatie die efficiënter met middelen omgaat de efficiencywinst niet aan de organisatie zelf ten goede komt, maar geheel of gedeeltelijk weer onder de beslissingsmacht van de principaal komt. Een voor de hand liggende gedragsreactie bij benchmarken is dan ook om op voorhand zoveel mogelijk waarborgen te verkrijgen, om te voorkomen dat aantastingen van het budget plaatsvinden. Bijvoorbeeld door vast te leggen dat benchmarkresultaten slechts gebruikt zullen worden als input voor een leerproces.
Op het moment dat deze waarborgen in onvoldoende mate aanwezig zijn, zal weerstand tegen benchmarken groeien. Deze kan zich manifesteren in pogingen onder de benchmark(verplichting) uit te komen, dan wel de benchmark van binnenuit uit te hollen. Dit laatste bijvoorbeeld door het ter discussie stellen van de indicatoren die de performance moeten weergeven.

De bovenbeschreven situatie is van betekenis voor het gebruik van het instrument benchmarking in de publieke sector. De initiatiefnemer voor een benchmark dient rekening te houden met de context waarin het instrument wordt gebruikt en de positie van waaruit dit wordt gedaan. Wat betreft de context gaat het om zaken als de budgettaire druk die kan bestaan of het ontbreken van vertrouwen in de sector waar de benchmarking plaatsvindt. Ook kan het gaan om meer specifieke omstandigheden, zoals sociaal-economische en/of geografische verschillen, de aanwezigheid van goede en actuele databestanden en consensus over meetprocedures in de sector. Wat betreft de positie van de initiatiefnemer wordt gedoeld op het bestaan van een hiërarchische (principaal – agent) relatie tussen partijen die bij de benchmark zijn betrokken. Is men bij de bekostiging van een voorziening direct of indirect afhankelijk van een principaal, dan legt het verbinden van benchmarkresultaten aan de bekostiging bedoeld of onbedoeld druk op de relatie. Immers voor de excellerende organisatie gaat gelden hoe men de positie kan uitnutten en hoe men de positie door de tijd heen kan handhaven. Voor de organisaties die slecht scoren speelt het zoveel mogelijk vermijden van negatieve consequenties en het vinden van een strategie om in de rangschikking te stijgen.

Door verschillende aspecten ten aanzien van het functioneren van organisaties naast elkaar te plaatsen, ontstaan beelden over het functioneren. Zwakke scores kunnen aanleiding zijn tot bijstelling in de bedrijfsvoering, tot ingrepen in het management. Dat hoeft niet altijd. Uit de analyse van de scores kan ook een bevredigende verklaring komen waarom de score lager is en dat dit in het licht van de prioriteitenstelling op andere terreinen, aanvaardbaar is. Het is dus wel degelijk zo dat deze systematische vergelijkingen die dus weliswaar geen benchmarkstudies zijn, hun nut kunnen afwerpen voor besturing, beheersing en verantwoording van publieke organisaties.

Gedragsreacties op benchmarkresultaten
In deze paragraaf wordt een verbinding gelegd tussen mogelijke gedragsreacties van een organisatie bij een benchmark en de setting waarin die benchmark plaatsvindt. Er wordt uitgegaan van het volgende conceptuele model.

TPC april 2007 blz 20.JPG
Beïnvloedende factoren op mate van acceptatie benchmark

Links in het model staat de benchmark. Aan de rechterkant staat de mate van acceptatie. Dit staat voor de geneigdheid van de organisatie om gebruik te maken van de resultaten van de benchmark, bijvoorbeeld in de zin van het consequenties trekken voor het beleid. De veronderstelling in dit conceptuele model is dat de mate van acceptatie afhankelijk is van de omstandigheden waaronder de benchmark plaatsvindt. Er wordt onderscheid gemaakt naar

de verplichting om deel te nemen;
het bestaan van een hiërarchische relatie tussen de initiatiefnemer van de benchmark en de organisatie die wordt vergeleken;
de organisatie het eens is met de gevolgde meetprocedure; en
of men zich vergelijkbaar acht met de rest van de organisaties in de benchmark.

De acceptatie van de resultaten van de benchmark kan in schema worden weergegeven. Het schema kent twee ingangen. De eerste betreft de positie van de organisatie die onderwerp is van de benchmark: één van afhankelijkheid of één van onafhankelijkheid.2 De andere ingang betreft contextuele factoren (sociaal-economische en geografische verschillen, betrouwbare databestanden, aanvaarde meetprocedures). Er wordt onderscheid gemaakt in een situatie waarbij consensus bestaat en één waarbij die afwezig is. De mate van acceptatie kan dan als volgt in beeld worden gebracht (zie eerste tabel).

		Mate van acceptatie
		Verknoping met bekostiging	Geen verknoping met bekostiging
Overeenstemming meetprocedure en perceptie t.a.v. vergelijkbaarheid	Hoog	1. Acceptatie	2. Acceptatie uit overtuiging
	Laag	3. Gedwongen acceptatie	4. Geen acceptatie

Acceptatie van benchmarkresultaten in relatie tot contextuele factoren

Uit de tabel wordt duidelijk dat in de situatie van een hoge mate van overeenstemming over de meetprocedure en men bovendien overtuigd is van de vergelijkbaarheid er in het geval van het verknopen van de resultaten van de benchmark aan bekostiging, er een acceptatie zal zijn van de uitkomsten.(situatie 1). Dit lijkt ook logisch omdat er als het ware geen argumenten zijn om tegen het gebruik van de resultaten te zijn. Zeker geldt dit in het geval er geen bekostigingsrelatie is (situatie 2). In de cellen met lage overeenstemming is men overtuigd van het verkeerde gebruik, maar men zal de budgettaire consequenties wel moeten aanvaarden, resp. er vindt geen acceptatie plaats.
Toch biedt het overzicht nog onvoldoende inzicht om gedragsreacties volledig te voorspellen. Het lijkt wel logisch dat in cel 1 acceptatie plaatsvindt, maar de relatieve score van een organisatie in de benchmark mag niet worden genegeerd. In een tweetal tabellen wordt dit verder uitgesplitst. Gedragsreacties van organisaties laten zich als volgt in beeld brengen.3 Er worden twee situaties onderscheiden: een slecht scorende organisatie en een goed scorende organisatie (zie de tweede tabel).

		Mogelijke gedragsreactie bij slechte scores in de benchmark
		Verknoping met bekostiging	Geen verknoping met bekostiging
Overeenstemming meetprocedure en perceptie t.a.v. vergelijkbaarheid	Hoog	Verzet	Leren van anderen Gebruik resultaten in de bedrijfsvoering ten einde positie te verbeteren
	Laag	Argumentenstrijd	Bureaulade

Gedragsreacties bij slechte score in de benchmark

In slechts één situatie is sprake van gebruik van de uitkomsten van de benchmark, namelijk waarbij de relaties tussen betrokken partijen in de benchmark wordt gekenmerkt door gelijkwaardigheid en onafhankelijkheid en waarbij sprake is van consensus over de contextuele factoren. In de overige situatie is sprake van verzet of het negeren van de uitkomsten (zie de derde tabel).

		Mogelijke gedragsreactie bij goede scores in de benchmark
		Verknopen met bekostiging	Geen verknoping met bekostiging
Overeenstemming meetprocedure en perceptie t.a.v. vergelijkbaarheid	Hoog	Uitnutten positie Gebruik resultaten in de bedrijfsvoering ten einde positie te handhaven	Gebruik resultaten in de bedrijfsvoering ten einde positie te handhaven
	Laag	Opportunistisch uitnutten positie	Hoogstens opportunistisch gebruik

Gedragsreacties bij goede score in de benchmark

In geval van een goede uitkomst voor de organisatie zien we in alle gevallen gebruik van de benchmarkresultaten, zowel in situaties met en zonder consequenties voor de bekostiging. In twee gevallen feitelijk niet terecht: daar waar de overeenstemming over meten en vergelijkbaarheid laag is. Of de goede uitkomst wordt gebruikt als argument voor bestendiging dan wel versterking van de positie in de bekostigingsrelatie in de wetenschap dat men weinig ziet in de wijze van meten, of de uitkomst wordt gebruikt als ‘vlagvertoon’ naar buiten in dezelfde wetenschap.

Conclusie
Centraal in het artikel staan gedragsreacties van publieke organisaties bij benchmarking. Benchmarking is daarbij ruim genomen, zijnde een systematische vergelijking van de performance van organisaties. Daarmee wordt wel afgeweken van de oorspronkelijke focus van benchmarking, namelijk die op efficiency. De ruime afbakening van benchmarking sluit echter beter aan bij de internationaal gedeelde opvatting over het instrument. Een complicerende factor bij benchmarking in de publieke sector, is het bestaan van waardencomplexiteit. Niet alle aspecten van belang van een oordeel over het functioneren van een organisatie kunnen in een benchmark een plaats krijgen. Waarden als toegankelijkheid, bejegening en transparantie zijn eveneens van belang en dus medebepalend voor allocatiebeslissingen. Een mogelijk principiëler verschil hangt samen met de budgetoriëntatie in de publieke sector. Efficiencywinsten kunnen door de beslissingsmacht van de principaal aan de agent worden onttrokken. Ook kunnen oordelen over de performance van organisaties (bijvoorbeeld op basis van een benchmark) tot herallocatie van middelen leiden. Deze dreiging kan tot gedragsreacties van de partijen in de benchmark aanleiding geven. Een andere factor die gedragsreacties kan veroorzaken, is de mate van consensus over de gevolgde meetprocedures en de perceptie t.a.v. onderlinge vergelijkbaarheid van hetgeen gebenchmarkt wordt. Gecombineerd levert dit op dat niet verknopen met bekostiging en een hoge mate van overeenstemming feitelijk de optimale situatie oplevert (benchmarking als middel om te leren). Verknoping met bekostiging levert in geval van het ontbreken van consensus in alle gevallen weerstand op, of hoogstens opportunistisch gebruik. Alleen in geval van consensus is het verbinden van budgettaire consequenties aan benchmarkingsresultaten een zinvolle optie.

Dr. H.L. Klaassen is universitair hooddocent economie, Opleiding Bestuurskunde, Erasmus Universiteit Rotterdam.

Noten
1 De term benchmarking is dan gereserveerd voor vergelijkingen met een gerichtheid op doelmatigheid en doeltreffendheid: “een techniek waarbij kerngegevens over het voortbrengingsproces van goederen en of diensten binnen een organisatie worden vergeleken met gegevens van één of meer andere organisaties, teneinde de doelmatigheid en doeltreffendheid in die organisatie te vergroten” (Hakvoort en Klaassen, 1999, p.12, ibid 2004, p.206).
2 Twee posities worden onderscheiden: één die zich kenmerkt door het bestaan van een hiërarchische relatie in de bekostiging en één waar deze ontbreekt en waar partijen in gelijkwaardigheid en onafhankelijkheid participeren.
Er wordt van afgezien om eigen initiatief ten opzichte van gedwongen deelname apart te onderscheiden. Daarnaast wordt verondersteld dat die in de eerstgenoemde twee posities vertegenwoordigd zijn.
3 Er wordt uitgegaan van zgn. extreme positieve of negatieve reacties. Het is natuurlijk altijd denkbaar dat een organisatie ‘milder’ reageert.

Literatuur

Blank, J.L.T., Public Provision and Performance. Contributions from Efficiency and Productivity Measurement, Elsevier Science, Amsterdam, 1999.
Blank, J., R. van der Aa, B. van Hulst, P. Koot en F. van Zutphen, Bureau of lessenaar. Een onderzoek naar de meting van bureaucratie in onderwijsinstellingen, Ecorys, Rotterdam, 2005.
Hakvoort, J.L.M. en H.L. Klaassen, Benchmarking in non-profit organisaties, in: Beleidsanalyse, nr. 3, 1999, p. 11-19.
Hakvoort J.L.M. en H.L. Klaassen, Bedrijfsvoeringstechnieken voor overheid en non-profitorganisaties, Sdu Uitgevers, Den Haag, 2004, p.122.
Rob (Raad voor het Openbaar bestuur), Presteren door leren. Benchmarken in het binnenlands bestuur, Den Haag, 2002.
Watson, G.H., Strategisch benchmarken. Hoe vergelijkt u de prestatie van uw bedrijf met die van de beste ter wereld. Scriptum Management, Schiedam, 1998.