Dua te ndertoj nje motor kerkimi qe te me hape faqe ne formatin pdf. A din kush te me ndihmoje ose te me sugjeroje ndonje material te mire per te lexuar per kete problem.
Po punoj me Apache - PHP - MySQL
Dua te ndertoj nje motor kerkimi qe te me hape faqe ne formatin pdf. A din kush te me ndihmoje ose te me sugjeroje ndonje material te mire per te lexuar per kete problem.
Po punoj me Apache - PHP - MySQL
Always searching.... Never finding.....
PHP-ja ka funksione për të krijuar PDF, por jo për të lexuar tekstin brënda tyre. Të gjithë funksionet e PHP për PDF mund t'i gjesh këtu.
E njëjta kompani që mundëson funksionet e krijimit të PDF në PHP ka krijuar dhe programin PDFLib TET që nxjerr tekstin nga një PDF. Ky mendoj se është programi ideal për ty por kushton mbi 250$. Megjithatë, mund ta provosh falas për pak kohë për të parë a të bën punë.
Mund të gjesh dhe programe të tjerë në Google që bëjnë të njëjtën gjë por s'besoj se do gjesh ndonjë të jetë falas. Të krijosh një softuer që kthen PDF-të në tekst kërkon shumë punë, sidomos për PDF-të që janë krijuar nga imazhet.
Edi
Gjithsesi flm !!!!Postuar më parë nga edspace
Always searching.... Never finding.....
Prit pak prit se ndoshta nuk jemi kuptuar mire... Ndoshta ste kam kuptuar une ty ose nuk kam mundur te sqarohem si duhet. Edhe nje here po e shpjegoj ate qe dua te realizoj:
Une dua te krijoj nje motor kerkimi brenda nje web site ku te mund te ruaj ne databaze linket per filet .pdf ose vete tekstin e tyre (per kete nuk jam e sigurt) dhe nepermjet motorit te kerkimit, nje perdorues i site-it te fuse ne te nje fjale qe ben pjese ne ate file .pdf dhe te marre si pergjigje file-t qe e permbajne ate fjale ose te mund te fuse dhe titullin e file-t dhe se fundi, te klijoje ne nje nga linket qe i hapen dhe klikimi ne to t`u sjelle perpara file-n .pdf, dmth njelloj si google deri diku, por jo per te kapur faqet e tjera te internetit qe permbajne fjalen hyrese ne text box, por thjesht te funksionoje brenda per brenda web site-it.
Sdi sa po arrij te shpjegohem .... Uroj te gjej ndonje ndihme, edhe ndihma me e vogel do te me ndihmonte shume. Gjer tani kam arritur te lidhem me databazen (MySQL) nepermjet faqeve PHP, dmth mund te fus te dhena ne databaze, te marr, te update-oj, por dua tu jap mundesine perdoruesve edhe te lexojne file .pdf nga web site-i ose ti downloadojne ato.... Nuk po di si te veproj, ose cfare te lexoj dhe ku te mbeshtetem per ta bere kete. ......
Always searching.... Never finding.....
Fillimisht mendova se do krijoje një motor kërkimi të ngjashëm me atë të Google. Meqënëse ti do e krijosh këtë motor vetëm për ueb sajtin tënd, atëherë ke disa mundësi më shumë.
Së pari, cfarëdo rruge të ndjekësh, duhet të nxjerrësh me patjetër tekstin e PDF-ve në formatin ASCII që të mund të ruhet në databazë ose si skedarë me tekst. Nëse ke dokumentin origjinal prej nga është krijuar PDF-ja, atëherë ruaje atë dokument si tekst. Nëse nuk ke tekstin origjinal të PDF-së, mund të mundohesh ta hapësh dhe t'ia kopjosh tekstin manualisht (nëse është PDF me tekst) ose me anë të ndonjë programi PDF-to-TXT (nëse është PDF me imazhe).
Pasi ke nxjerrë tekstin, ke dy mundësi për ta ruajtur atë: në databazë, ose në hard disk. Nëse e ruan në databazë, kërkimi është me i lehtë dhe më i shpejtë, por do rritet shumë madhësia e databazës dhe serveri do kërkojë më shumë memorje. Nëse i ruan skedarët me tekst në hard disk, kërkimi i tyre do jetë pak më i vështirë dhe do kërkojë kohë më të gjatë, por nuk do ngarkojë databazën dhe nuk do shfrytëzojë shumë memorje.
Për mendimin tim, nëse skedarët me tekst (të nxjerrë nga PDF-të) janë të vegjël (rreth 300KB), atëherë mund t'i ruash në databazë. Nëse janë të mëdhenj (500+ KB), atëherë ruaji më mirë në hard disk duke mbajtur vetëm e emrin e skedarit në databazë.
Më lart po flas vetëm për tekstin e PDF-ve, por të njëjtën gjë duhet të vendosësh edhe për skedarët PDF. Unë do të këshilloja t'i ruajë PDF-të në hard disk dhe të ruaje vetëm emrin e tyre në databazë. Kështu nuk e ngarkon databazën kur të shkarkohen PDF-të.
Nëse zgjedh të ruash tekstin në databazë, do krijosh një tabelë me këto kolona:
1. emri i skedarit pdf, powerpoint, excel, etj. - varchar
2. tipi i skedarit (pdf, powepoint, excel, etj.) - varchar (fakultative nese tek emri vendos edhe prapashtesen)
3. teksti ne formatin ASCII - text
4. madhesia e skedarit PDF (nese te duhet)
5. data kur eshte krijuar/modifikuar/hedhur ne databaze, etj. (nese te duhet)
Kështu mund të krijosh kërkesa (query) për të gjetur fjalë në kolonën e tekstit ASCII. Nga rreshtat rezultues mund të krijosh lidhje për tek skedari PDF duke bashkuar adresen e dosjes me PDF me kolonën e emrit. P.Sh:
$emri_skedarit = $rreshtiDB['emri _i_skedarit'];
$url = '/raportet/PDF/' . $emri_skedarit;
...
Edi
Krijoni Kontakt