- Title
-
Poland - Warsaw: IT services: consulting, software development, Internet and support
- Award criteria
-
priceOnly
- Award criteria details
-
Lowest price
Award criteria for item 1:
- Price
- Main procurement category
-
services
- Procurement method details
-
Negotiated without a prior call for competition
Justification:
Jedynym znanym Zamawiającemu obrazem polskiego Internetu jest System NEKST, który ma zastosowanie w walce z plagiaryzmem w systemie OSA. Jest to rozwiązanie unikalne w skali kraju, dysponujące bazą ponad 700 mln zindeksowanych dokumentów internetowych pobranych z sieci polskiego Internetu. System jest zbudowany w oparciu o klaster 74 wysokowydajnych serwerów obliczeniowych.Wydajne zbieranie, a także odświeżanie tak dużej kolekcji dokumentów internetowych wymaga specjalizowanego oprogramowania oraz znacznych zasobów obliczeniowych. Ponadto zgromadzenie bazy dokumentów internetowych o takim rozmiarze wymaga wielomiesięcznej pracy całego klastra serwerów oraz wydajnego łącza internetowego. Wpływ na to mają dwa czynniki: obostrzenia co do prędkości pobierania stron z poszczególnych serwisów internetowych oraz duża zasobożerność samego procesu pobierania treści internetowych. Realizacja usługi- pozyskiwania danych, analizy i wyszukiwania, zbierania stron polskiego Internetu realizowana będzie przez szereg specjalizowanych systemów:
1. rozproszony system plików;
2. autorską, dedykowaną, wysokowydajną rozproszoną bazę danych typu NoSQL;
3. system rozproszonego przetwarzania danych;
4. autorski system do zarządzania uruchamianiem procesów rozproszonego przetwarzania danych;
5. autorski, wysokowydajny system pająka internetowego, działającego w sposób rozproszony. Jedynie IPI PAN posiada techniczne możliwości i doświadczenie w zbieraniu i aktualizacji polskojęzycznych zasobów internetowych pod kątem zastosowań w walce z plagiaryzmem. Skuteczność pobierania dokumentów internetowych jest również zależna od renomy posiadanej przez instytucję zbierającą wśród administratorów stron internetowych. Jeżeli administracja IT danego portalu nie będzie miała zaufania do instytucji zbierającej, to może uniemożliwić ściąganie swoich stron internetowych z obawy przed bezprawnym powielaniem ich treści i w trosce o swoje zasoby (prąd, przepustowość łącza internetowego), które proces zbierania generuje po stronie portalu. Zaufanie jakim cieszy się IPI PAN zbierając strony internetowe było zdobywane przez lata, w okresie realizacji projektu NEKST i wynika z zaufania jakim w Polsce darzy się instytuty Polskiej Akademii Nauk, w tym IPI PAN realizujący cel powszechnego udostępniania wyszukiwarki polskiego Internetu. Co więcej, połączenie dedykowanego klastra obliczeniowego oraz unikalnego oprogramowania do wydajnej obsługi tego zasobu jest rozwiązaniem, które nie posiada odpowiedników na rynku.
- Tender period
-
2017-07-18
-
?