Blog: Data

Geplaatst op 28 mei 2020

Tags

Fokke Buwalda is directeur van B-Mex B.V. in Wageningen. Fokke schrijft deze blog exclusief voor Goedemorgen.

In 2017 kwam het gezaghebbende opinieblad The Economist met een artikel: Het meest waardevolle op aarde is niet langer olie, maar data. Niet langer zijn de koersen van Texaco, ExxonMobil, Shell en Aramco het meest bepalend voor de stemming op de aandelenbeurzen, maar die van de digitale reuzen zoals Amazon, Alphabet (Google), Tencent, Microsoft en Facebook. In de tuinbouw vinden we onszelf graag toonaangevend. We hebben al jaren een 'Kas als Energiebron' maar waarom eigenlijk nog geen 'Kas als Databron'?

We gebruiken sinds jaar en dag data voor bedrijfsvergelijking. In excursiegroepen wordt gekeken wie de afgelopen week het meeste heeft geplukt, en schermstanden, raamstanden en drainpercentages worden uitgeplozen om de oorzaak te achterhalen.

Tegenwoordig gaat het regelmatig over 'data-gedreven telen'. Registreren en vergelijken waren we dus al gewend. Eerst in Excel, de laatste jaren steeds meer in online dataplatforms. Er zijn ook nieuwe aanbieders van data op de markt verschenen, op basis van allerlei sensoren en beeldanalyses . Rond de eeuwwisseling had je trouwens al de Phytomonitor, een revolutionair apparaat waarmee de activiteit van planten rechtstreeks kon worden gemeten, snel gevolgd door de GrowWatch en de I4All. Potentieel was die data uiterst waardevol, maar uit de praktijk blijkt dat het destijds niet tot een doorbraak heeft geleid. Kennelijk ligt het ingewikkelder dan: hoe meer data, hoe beter. Zal het nu met de nieuwe generatie databronnen anders gaan?

Wij van B-Mex passen ook ergens in dat plaatje. "Kennis op de werkvloer!" is onze strijdkreet. Wij leggen kennis van plantenfysiologie en kasklimaat vast in rekenregels. Data is natuurlijk de olie waarop onze modellen draaien.

Wij werken dagelijks met metingen en registraties die rechtstreeks afkomstig zijn van tuinbouwbedrijven. Vaak dezelfde gegevens die telers ook binnen excursiegroepen vergelijken. Rekenmodellen zijn nieuw voor de meeste bedrijven, dus tuinders vragen zich af: "klopt dat model wel?" Logisch. Dat vragen wij onszelf ook dagelijks af.

De praktijk blijkt daarin behoorlijk weerbarstig. Wij komen regelmatig gevallen tegen waarbij het model niet goed leek te voorspellen. Vaak blijkt na analyse de afwijking niet in het model te zitten maar in de data waarmee wordt vergeleken. Zoals bij een tomatenteelt waarbij we, als je het gemiddelde vruchtgewicht vermenigvuldigde met het aantal geoogste stuks, niet eens in de buurt kwamen van het aantal geoogste kilo's. Of een model dat klimaatgegevens kreeg uit een andere afdeling dan die waar het gewas stond. Of een gerberateelt, waar het aantal nieuw gevormde knoppen, vermenigvuldigd met de uitgroeiduur, totaal niet klopte met de getelde plantbelasting. Als een teler ziet dat een registratie niet klopt met de modelberekening, dan is de eerste reactie: "het model klopt niet, hier heb ik niks aan!" Maar als dergelijke simpele checks niet worden gedaan dan blijven de fouten er dus in zitten. Hoe moet dat dan straks gaan met het data-gedreven telen? Grappig genoeg merken wij dat een model juist kan helpen om tegenstrijdigheden in data te detecteren en op te lossen. Zo komt uit een lastig probleem onverwacht een nieuwe toegevoegde waarde van modellen naar voren.

Zolang we foute data in modellen stoppen zullen er altijd foute antwoorden uit blijven komen. Willen we dus van data als de nieuwe olie profiteren, dan zullen we die eerst nog moeten raffineren.

Bron: Fokke Buwalda