PHPAmersfoort Message Board › Solr herindexeren

Solr herindexeren

Pim
user 143491602
Amersfoort, NL
Post #: 2
Voor onze website maken we gebruik van Solr om te zoeken in onze db.

Relevante data is allemaal geindexeerd door Solr maar we willen alles laten herindexeren. De grootste tabel bevat bijna 400k records. Daarbij is het ook zo dat bijgewerkte records ook constant worden geherindexeerd middels een cron.

Om een duidelijk(er) beeld te schetsen van de situatie:
Tabel x bevat een veld 'solr_done' met Y/N als value.
Een cronjob die elke 2 minuten loopt kijkt of er velden met 'N' zijn zodat het betreffende record wordt klaargezet voor (her)indexatie voor Solr.

Willen we alles laten herindexeren. Een mogelijkheid is om alle records op 'N' te zetten zodat deze worden opgepikt door de cron of om per chunk een x-aantal rijen op 'N' te zetten zodat ze worden opgepikt door de cron.

1. De vraag is of dat mogelijk is en hoe Solr dit verwerkt/aan kan i.c.m. de cron die elke 2 minuten loopt.
2. Heeft dit invloed op de gebruikerservaring en indien ja, wat voor invloed?
Richard T.
user 79269192
Amersfoort, NL
Post #: 5
1. Dat moet geen probleem zijn als je het indexeringsproces lockt. Dit zorgt ervoor dat het niet opnieuw start als het proces nog niet is afgerond.
2. Dat hangt volledig af van de inrichting. Als de cron/solr op een aparte server draait zullen de clients alleen een kleiner resultset terugkrijgen als de indexering nog niet is afgerond.
Als Solr/db/webserver op dezelfde server draaien dan zal er ook wel wat vertraging optreden.

Als je geen process lock op de cron hebt raad ik aan om de cron tijdelijk te stoppen op een rustig moment, de data uit solr verwijderen en dan eenmalig handmatig het proces te starten via de console.
Powered by mvnForum

Our Sponsors

People in this
Meetup are also in:

Sign up

Meetup members, Log in

By clicking "Sign up" or "Sign up using Facebook", you confirm that you accept our Terms of Service & Privacy Policy