“Tesztelve a következővel”, “Author” to “Szerző”. Keep dates unchanged.
Now produce final markdown with Hungarian translation.
Make sure to keep code block placeholders unchanged.
Also ensure we keep any bold formatting (** **) and inline code unchanged.
Let’s craft final answer.# A java fájlkiterjesztés szűrő elsajátítása a GroupDocs.Search segítségével
A dokumentumok növekvő tárházának kezelése gyorsan túlterhelővé válhat, különösen akkor, ha csak bizonyos fájltípusokat kell indexelni. A java fájlkiterjesztés szűrő lehetővé teszi, hogy pontosan megadd a GroupDocs.Search‑nek, mely kiterjesztéseket vegye fel vagy hagyja ki, így precíz irányítást kapsz az indexelési folyamatod felett. Ebben az útmutatóban lépésről‑lépésre bemutatjuk a GroupDocs.Search for Java beállítását, és megmutatjuk, hogyan kombinálhatod a fájlkiterjesztés szűrését logikai AND, OR és NOT operátorokkal, valamint dátumtartomány és útvonal szűrőkkel.
Gyors válaszok
- Mi a java fájlkiterjesztés szűrő? Egy konfiguráció, amely megmondja a GroupDocs.Search‑nek, mely fájlkiterjesztéseket kell belefoglalni vagy kizárni az indexelés során.
- Melyik könyvtár biztosítja ezt a funkciót? GroupDocs.Search for Java.
- Szükségem van licencre? Egy ingyenes próba a kiértékeléshez megfelelő; a termeléshez teljes licenc szükséges.
- Összekapcsolhatok szűrőket? Igen – összefűzheted a kiterjesztés, dátum, méret és útvonal szűrőket AND, OR, NOT logikával.
- Maven‑kompatibilis? Teljesen – add hozzá a GroupDocs.Search függőséget a
pom.xml‑hez.
Mi a java fájlkiterjesztés szűrő?
A java fájlkiterjesztés szűrő egy szabálykészlet, amely minden fájl kiterjesztését kiértékeli, mielőtt az indexelő motorhoz kerülne. Az olyan kiterjesztések megadásával, mint .txt, .pdf vagy .epub, belefoglalhatod a fájlokat kiterjesztés szerint vagy kizárhatod a fájlokat kiterjesztés szerint, hogy az indexed fókuszált maradjon, és a keresési eredmények relevánsak legyenek.
Miért használjunk fájlkiterjesztés szűrést a GroupDocs.Search‑szel?
- Teljesítmény: A nem kívánt fájlok kihagyása csökkenti az I/O‑t és felgyorsítja az indexelést.
- Tárhely megtakarítás: Csak a releváns dokumentumok kerülnek az indexbe, csökkentve a lemezhasználatot.
- Megfelelőség: Megakadályozza a bizalmas vagy nem támogatott fájltípusok véletlen indexelését.
- Rugalmasság: Kombináld a date range filter java funkciókkal, hogy a konkrét időszakokban létrehozott vagy módosított fájlokat célozd meg.
Előkövetelmények
Mielőtt elkezdenénk, győződj meg róla, hogy a következőkkel rendelkezel:
Szükséges könyvtárak és függőségek
- GroupDocs.Search for Java: 25.4 vagy újabb verzió
- Java Development Kit (JDK): Telepített kompatibilis verzió
Környezet beállítása
- Integrated Development Environment (IDE): IntelliJ IDEA, Eclipse vagy bármely Maven‑kompatibilis IDE.
Tudás előkövetelmények
- Alap Java programozás
- Fájl I/O ismerete Java‑ban
- Reguláris kifejezések és dátum‑idő kezelés megértése
A GroupDocs.Search beállítása Java‑hoz
A GroupDocs.Search használatához hozzá kell adnod a projekted függőségei közé.
Maven konfiguráció
Add hozzá a következő tárolót és függőség‑konfigurációt a pom.xml fájlodhoz:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Közvetlen letöltés
Alternatívaként töltsd le a legújabb verziót közvetlenül a GroupDocs.Search for Java releases oldalról.
Licenc megszerzése
- Free Trial – felfedezheted a funkciókat költség nélkül.
- Temporary License – teljes funkcionalitás korlátozott időre.
- Purchase – állandó licenc a termelési használathoz.
Alap inicializálás és beállítás
Miután a könyvtárat hozzáadtad, inicializáld az indexelési környezetet:
import com.groupdocs.search.*;
String indexFolder = "YOUR_OUTPUT_DIRECTORY";
Index index = new Index(indexFolder);
Implementációs útmutató
Az alábbiakban minden szűrőtípusra részletesen kitérünk, megmagyarázva miért fontos, és lépésről‑lépésre bemutatva a kódot, amelyet egyszerűen átmásolhatsz a projektedbe.
Fájlkiterjesztés szűrés
Fájlok szűrése kiterjesztésük alapján az indexelés során. Ideális, ha csak e‑könyveket (.fb2, .epub) és egyszerű szövegfájlokat (.txt) szeretnél feldolgozni.
Áttekintés
Használd a DocumentFilter.createFileExtension metódust a fehérlista létrehozásához.
Implementációs lépések
Create Filter:
DocumentFilter filter = DocumentFilter.createFileExtension(".fb2", ".epub", ".txt"); IndexSettings settings = new IndexSettings(); settings.setDocumentFilter(filter);Initialize Index and Add Documents:
Index index = new Index("YOUR_OUTPUT_DIRECTORY\\FileExtensionFilter", settings); index.add("YOUR_DOCUMENT_DIRECTORY");
Logikai NOT szűrő
Kizárhatod a nem kívánt kiterjesztéseket, például weboldalakat és PDF‑eket, ha azok nem szükségesek a keresési forgatókönyvedben.
Implementációs lépések
Create Exclusion Filter:
DocumentFilter filterNot = DocumentFilter.createFileExtension(".htm", ".html", ".pdf"); DocumentFilter invertedFilter = DocumentFilter.createNot(filterNot);Apply to Index Settings:
IndexSettings settingsNot = new IndexSettings(); settingsNot.setDocumentFilter(invertedFilter);Add Documents:
Index indexNot = new Index("YOUR_OUTPUT_DIRECTORY\\LogicalNotFilter", settingsNot); indexNot.add("YOUR_DOCUMENT_DIRECTORY");
Logikai AND szűrő
Több feltétel egyesítése – létrehozási dátum, kiterjesztés és fájlméret – úgy, hogy csak azok a fájlok kerüljenek indexelésre, amelyek minden kritériumnak megfelelnek.
Áttekintés
A DocumentFilter.createAnd több szűrőt egyetlen szabályba egyesít.
Implementációs lépések
Define Filters:
DocumentFilter filter1 = DocumentFilter.createCreationTimeRange(Utils.createDate(2015, 1, 1), Utils.createDate(2016, 1, 1)); DocumentFilter filter2 = DocumentFilter.createFileExtension(".txt"); DocumentFilter filter3 = DocumentFilter.createFileLengthUpperBound(8 * 1024 * 1024);Combine Filters:
DocumentFilter finalFilterAnd = DocumentFilter.createAnd(filter1, filter2, filter3); IndexSettings settingsAnd = new IndexSettings(); settingsAnd.setDocumentFilter(finalFilterAnd);Index Documents:
Index indexAnd = new Index("YOUR_OUTPUT_DIRECTORY\\LogicalAndFilter", settingsAnd); indexAnd.add("YOUR_DOCUMENT_DIRECTORY");
Logikai OR szűrő
Fájlok bevétele, amelyek bármelyik megadott feltételnek megfelelnek – hasznos, ha kis szövegfájlokat és nagyobb nem‑szöveg fájlokat egyaránt szeretnél lefedni.
Implementációs lépések
Define Filters:
DocumentFilter txtFilter = DocumentFilter.createFileExtension(".txt"); DocumentFilter notTxtFilter = DocumentFilter.createNot(txtFilter);Combine Filters with Logical Conditions:
DocumentFilter bound5Filter = DocumentFilter.createFileLengthUpperBound(5 * 1024 * 1024); DocumentFilter bound10Filter = DocumentFilter.createFileLengthUpperBound(10 * 1024 * 1024); DocumentFilter txtSizeFilter = DocumentFilter.createAnd(txtFilter, bound5Filter); DocumentFilter notTxtSizeFilter = DocumentFilter.createAnd(notTxtFilter, bound10Filter);Finalize OR Filter:
DocumentFilter finalFilterOr = DocumentFilter.createOr(txtSizeFilter, notTxtSizeFilter); IndexSettings settingsOr = new IndexSettings(); settingsOr.setDocumentFilter(finalFilterOr); Index indexOr = new Index("YOUR_OUTPUT_DIRECTORY\\LogicalOrFilter", settingsOr); indexOr.add("YOUR_DOCUMENT_DIRECTORY");
Létrehozási idő szűrők
Célzott fájlok, amelyek egy adott időszakon belül lettek létrehozva – klasszikus date range filter java szituáció.
Implementációs lépések
Define Date Range Filter:
DocumentFilter filter3CTime = DocumentFilter.createCreationTimeRange(Utils.createDate(2017, 1, 1), Utils.createDate(2018, 6, 15)); IndexSettings settingsCTime = new IndexSettings(); settingsCTime.setDocumentFilter(filter3CTime);Index Documents:
Index indexCTime = new Index("YOUR_OUTPUT_DIRECTORY\\CreationTimeFilters", settingsCTime); indexCTime.add("YOUR_DOCUMENT_DIRECTORY");
Módosítási idő szűrők
Kizárhatod azokat a fájlokat, amelyeket egy bizonyos határidő után módosítottak.
Implementációs lépések
Define Filter:
DocumentFilter filter2MTime = DocumentFilter.createModificationTimeUpperBound(Utils.createDate(2018, 6, 15)); IndexSettings settingsMTime = new IndexSettings(); settingsMTime.setDocumentFilter(filter2MTime);Index Documents:
Index indexMTime = new Index("YOUR_OUTPUT_DIRECTORY\\ModificationTimeFilters", settingsMTime); indexMTime.add("YOUR_DOCUMENT_DIRECTORY");
Fájl útvonal szűrés
Az indexelés korlátozása olyan fájlokra, amelyek meghatározott mappákban vagy egy mintának megfelelően helyezkednek el – ideális include files by extension esetén egy adott könyvtárhierarchián belül.
Implementációs lépések
Define File Path Filter:
DocumentFilter pathFilter = DocumentFilter.createPath("*.txt", "documents/"); IndexSettings settingsPath = new IndexSettings(); settingsPath.setDocumentFilter(pathFilter);Initialize Index and Add Documents:
Index indexPath = new Index("YOUR_OUTPUT_DIRECTORY\\FilePathFilter", settingsPath); indexPath.add("YOUR_DOCUMENT_DIRECTORY");
Gyakori hibák és tippek
- Never mix absolute and relative paths in the same filter configuration – it can lead to unexpected exclusions.
Soha ne keverd az abszolút és relatív útvonalakat ugyanabban a szűrőkonfigurációban – ez váratlan kizárásokhoz vezethet. - Reset the
IndexSettingswhen switching filter sets; otherwise previous filters may persist.
Állítsd vissza azIndexSettings‑t szűrők cseréjekor; különben a korábbi szűrők megmaradhatnak. - Combine a length upper bound with an extension filter for large collections to keep memory usage low.
Kombináld a maximális hosszkorlátot egy kiterjesztés szűrővel nagy gyűjteményeknél, hogy alacsonyan tartsd a memóriahasználatot. - Enable logging (
LoggingOptions.setEnabled(true)) to see why a file was rejected.
Engedélyezd a naplózást (LoggingOptions.setEnabled(true)), hogy lásd, miért lett egy fájl elutasítva.
Gyakran feltett kérdések
Q: Can I change the filter criteria after the index is created?
A: Yes. Rebuild the index with a new DocumentFilter or use incremental indexing with updated settings.
Q: Does the java file extension filter work on compressed archives (e.g., ZIP)?
A: GroupDocs.Search can index supported archive formats, but the extension filter applies to the archive itself, not the inner files. Use nested filters for deeper control.
Q: How do I debug why a particular file was excluded?
A: Enable the library’s logging (LoggingOptions.setEnabled(true)) and inspect the log – it reports which filter rejected each file.
Q: Is it possible to combine the java file extension filter with custom regex filters?
A: Absolutely. Wrap a regex filter inside DocumentFilter.createAnd() alongside the extension filter.
Q: What performance impact does adding many filters have?
A: Each filter adds a modest overhead during indexing, but the reduction in indexed data usually outweighs the cost. Test with a representative sample to find the optimal balance.
Utolsó frissítés: 2026-02-21
Tesztelve a következővel: GroupDocs.Search 25.4 for Java
Szerző: GroupDocs