Топ-100
Back

ⓘ వేబ్యాక్ మెషీన్ అనేది వరల్డ్ వైడ్ వెబ్ ను ఆర్కైవు చేసే భాండాగారం. ఇది శాన్ఫ్రాన్సిస్కోలో ఉన్న లాభాపేక్షలేని సంస్థ. దీన్ని ఇంటర్నెట్ ఆర్కైవ్ సంస్థ స్థాపించింది. ..




వేబ్యాక్ మెషీన్
                                     

ⓘ వేబ్యాక్ మెషీన్

వేబ్యాక్ మెషీన్ అనేది వరల్డ్ వైడ్ వెబ్ ను ఆర్కైవు చేసే భాండాగారం. ఇది శాన్ఫ్రాన్సిస్కోలో ఉన్న లాభాపేక్షలేని సంస్థ. దీన్ని ఇంటర్నెట్ ఆర్కైవ్ సంస్థ స్థాపించింది. ఇది వినియోగదారుని" పాత జ్ఞాపకాలకు తిరిగి” తీసుకువెళ్తుంది. ఆయా వెబ్‌సైట్‌లు గతంలో ఎలా ఉండేవో చూడటానికీ వీలు కల్పిస్తుంది. దాని వ్యవస్థాపకులు బ్రూస్టర్ కహ్లే, బ్రూస్ గిలియట్. ఆన్‌లైన్లో లేని వెబ్‌పేజీల కాపీలను భద్రపరచడం ద్వారా "విజ్ఞానం యావత్తునూ సార్వత్రికంగా అందుబాటులో" ఉంచాలనే ఉద్దేశ్యంతో వేబ్యాక్ యంత్రాన్ని అభివృద్ధి చేశారు.

2001 లో మొదలైనప్పటి నుండి, ఇది 452 బిలియన్లకు పైగా పేజీలను ఆర్కైవుకు చేర్చింది. వెబ్‌సైటు స్వంతదారు అనుమతి లేకుండా ఆర్కైవు పేజీలను తయారు చెయ్యటం కాపీహక్కుల ఉల్లంఘన అవుతుందా లేదా అనే విషయమై కొన్ని చోట్ల వివాదం తలెత్తింది.

                                     

1. చరిత్ర

ఇంటర్నెట్ ఆర్కైవ్ వ్యవస్థాపకులైన బ్రూస్టర్ కహ్లే, బ్రూస్ గిలియట్‌లు 2001 లో వేబ్యాక్ మెషీన్ను ప్రారంభించారు. వెబ్‌సైటు మారినప్పుడు లేదా అసలు వెబ్‌సైటునే మూసేసినప్పుడూ అందులోని పాఠ్యం, ఇతర విషయాలూ అదృశ్యమైపోతాయి. ఈ సమస్యను పరిష్కరించడమే ఈ ప్రాజెక్టు లక్ష్యం. ఈ ఆర్కైవు వెబ్ పేజీల పాత కూర్పులను వినియోగదారులకు చూపిస్తుంది. ఆర్కైవ్ వారు దీన్ని "త్రిమితీయ సూచిక" త్రీ డైమెన్షనల్ ఇండెక్స్ అని అంటారు. కహ్లే, గిలియాట్‌లు ఈ యంత్రంతో యావత్తు అంతర్జాలాన్నీ ఆర్కైవు చేయాలనీ, "విజ్ఞానం యావత్తునూ సార్వత్రికంగా" అందించాలనీ ఆశించారు.

యానిమేటెడ్ కార్టూన్ అయిన ది రాకీ అండ్ బుల్‌వింకిల్ షోలో మిస్టర్ పీబాడీ, షెర్మాన్ పాత్రలు ఉపయోగించిన కాల్పనిక కాల-ప్రయాణ పరికరం WABAC మెషీన్ దీన్ని వే-బ్యాక్ అని ఉచ్చరిస్తారు పేరు మీదుగా దీనికి ఈ పేరు పెట్టారు. ఈ యానిమేటెడ్ కార్టూన్ విభాగాలలో ఒకటైన ఇంప్రాబబుల్ హిస్టరీ లోని పాత్రలు చరిత్రలో ప్రసిద్ధి చెందిన సంఘటనలను చూడడానికి, వాటిలో పాల్గొనడానికీ, వాటిని మార్చడానికి ఈ యంత్రాన్ని ఉపయోగించాయి.

ఐదేళ్ల తరువాత తమ సేవను అందరికీ అందజేయాలనే లక్ష్యంతో వేబ్యాక్ మెషీన్ 1996 లో, కాషె చేసిన వెబ్ పేజీలను ఆర్కైవు చేయడం ప్రారంభించింది. 1996 నుండి 2001 వరకు సేకరించిన సమాచారాన్ని డిజిటల్ టేప్‌లో ఉంచారు. ఈ ముడి డేటాబేసును చూసేందుకు అప్పుడప్పుడు పరిశోధకులను, శాస్త్రవేత్తలనూ అనుమతించేవారు. 2001 లో ఆర్కైవు ఐదవ వార్షికోత్సవం నాడు బర్కిలీలోని కాలిఫోర్నియా విశ్వవిద్యాలయంలో జరిగిన కార్యక్రమంలో దీనిని ఆవిష్కరించి ప్రజలు చూసేందుకు తెరిచారు. అప్పటికే ఇది 10 బిలియన్లకు పైగా పేజీలను ఆర్కైవు చేసింది.

నేడు, డేటాను ఇంటర్నెట్ ఆర్కైవ్ యొక్క పెద్ద క్లస్టర్ లైనక్స్ నోడ్‌లలో నిల్వ చేస్తున్నారు. ఇది సమయానుసారంగా వెబ్‌సైట్ల క్రొత్త కూర్పులను చూసి ఆర్కైవు చేస్తూంటుంది. వెబ్‌సైట్ URL ను శోధన పెట్టెలో ఇచ్చి ఆ సైట్‌ను మానవికంగా కూడా ఆర్కైవు చెయ్యవచ్చు. సదరు వెబ్‌సైట్ వేబ్యాక్ మెషీన్‌ను "క్రాల్" చేయడానికీ, డేటాను సేవ్ చేయడానికీ అనుమతిస్తున్నట్లైతేనే ఇది సాధ్యపడుతుంది.

                                     

2. సాంకేతిక వివరాలు

వెబ్‌ను "క్రాల్" చేయడానికీ సార్వజనికంగా చూడగల అన్ని వరల్డ్ వైడ్ వెబ్ పేజీలు, గోఫర్ సోపానక్రమం, నెట్‌న్యూస్ యూస్‌నెట్ బులెటిన్ బోర్డ్ సిస్టం లను డౌన్‌లోడు చేసుకోగల సాఫ్ట్‌వేరును అభివృద్ధి చేసారు. ఇంటర్నెట్‌లో అందుబాటులో ఉన్న మొత్తం సమాచారాన్ని ఈ "క్రాలర్లు" సేకరించవు. ఎందుకంటే ప్రచురణకర్తలు చాలా డేటాపై పరిమితి విధిస్తారు. లేదా అందుకోలేని డేటాబేస్‌లలో నిల్వ చేస్తారు. పాక్షికంగా కాషె చేసిన వెబ్‌సైట్లలోని అసమానతలను అధిగమించడానికి, ఆర్కైవ్- It.org సైటును 2005 లో ఇంటర్నెట్ ఆర్కైవ్ అభివృద్ధి చేసింది. సంస్థలు, కంటెంట్ సృష్టికర్తలు స్వచ్ఛందంగా డిజిటల్ కంటెంట్ సేకరణలను సేకరించి సంరక్షించడానికి, డిజిటల్ ఆర్కైవ్‌లను సృష్టించడానికి వీలుగా దీన్ని సృష్టించారు.

క్రాల్స్‌ను వివిధ వనరులు అందిస్తాయి. కొన్నిటిని మూడవ పార్టీల నుండి తెచ్చ్చుకుంటారు. మరికొన్ని ఆర్కైవ్ స్వయంగా అభివృద్ధి చేసుకుంటుంది. ఉదాహరణకు, స్లోన్ ఫౌండేషన్ వారు, అలెక్సా వారూ క్రాల్స్‌ను అందించారు. నారా, ఇంటర్నెట్ మెమరీ ఫౌండేషన్ తరపున IA క్రాల్ చేస్తూంటుంది. "ప్రపంచవ్యాప్త వెబ్ క్రాల్స్" 2010 నుండి నడుస్తున్నాయి.

స్నాప్‌షాట్‌లను సంగ్రహించే తరచుదనం వెబ్‌సైట్‌ నుండి వెబ్‌సైట్‌కు మారుతూ ఉంటుంది. "ప్రపంచవ్యాప్త వెబ్ క్రాల్స్" లోని వెబ్‌సైట్లు "క్రాల్ జాబితా" లో చేర్చారు. ప్రతి క్రాల్‌కు ఒకసారి ఇవి సైటును ఆర్కైవ్ చేస్తాయి. ఒక క్రాల్ పరిమాణాన్ని బట్టి, అది పూర్తి కావడానికి నెలలూ, సంవత్సరాలూ పడుతుంది. ఉదాహరణకు, "వైడ్ క్రాల్ నంబర్ 13" జనవరి 9, 2015 న ప్రారంభమై, జూలై 11, 2016 న పూర్తయింది. అయితే, ఒకే సమయంలో ఒకటి కంటే ఎక్కువ క్రాల్‌లు జరగవచ్చు. ఒక సైట్ ఒకటి కంటే ఎక్కువ క్రాల్ జాబితాలో చేరవచ్చు. అందుచేత ఒక సైటును ఎంత తరచుగా క్రాల్ చేసారనేది బాగా మారుతూంటుంది.

                                     

2.1. సాంకేతిక వివరాలు నిల్వ సామర్థ్యం, పెరుగుదల

సంవత్సరాలుగా టెక్నాలజీ అభివృద్ధి చెందడంతో, వేబ్యాక్ మెషీన్ యొక్క నిల్వ సామర్థ్యం పెరిగింది. 2003 లో, సైటు ప్రజలకు అందుబాటు లోకి వచ్చిన రెండేళ్ళ తరువాత, వేబ్యాక్ మెషీన్ ఎదుగుదల నెలకు 12 టెరాబైట్ల చొప్పున ఉంది. ఇంటర్నెట్ ఆర్కైవ్ సిబ్బంది ప్రత్యేకంగా రూపొందించిన పెటాబాక్స్ ర్యాక్ సిస్టమ్స్‌లో డేటాను నిల్వ చేస్తారు. మొదటి 100 టిబి ర్యాక్ జూన్ 2004 లో పూర్తిగా పని లోకి వచ్చింది. అయితే, దాని కంటే చాలా ఎక్కువ నిల్వ అవసరమని త్వరలోనే స్పష్టమైంది.

ఇంటర్నెట్ ఆర్కైవ్ దాని అనుకూలీకరించిన నిల్వ ఆర్కిటెక్చరు నుండి 2009 లో సన్ ఓపెన్ స్టోరేజ్‌కు మారింది. సన్ మైక్రోసిస్టమ్స్ కాలిఫోర్నియా క్యాంపస్‌లోని సన్ మాడ్యులర్ డేటాసెంటర్‌లో కొత్త డేటా సెంటర్‌ను తెరిచింది. 2009 నాటికి వేబ్యాక్ మెషీన్లో సుమారు మూడు పెటాబైట్ల డేటా ఉంది. ప్రతి నెలా 100 టెరాబైట్ల చొప్పున పెరుగుతోంది.

అప్‌డేట్ చేసిన ఇంటర్‌ఫేసుతో, ఆర్కైవు చేసిన కంటెంటు యొక్క తాజా ఇండెక్సుతో వేబ్యాక్ మెషీన్ యొక్క కొత్త, మెరుగైన కూర్పును 2011 లో ప్రజల పరీక్ష కోసం అందుబాటులో ఉంచారు. అదే సంవత్సరం మార్చిలో, వేబ్యాక్ మెషీన్ ఫోరమ్‌లో ఇల ప్రకటించారు:ళ్"కొత్త వేబ్యాక్ మెషీన్ యొక్క బీటా కూర్పులో 2010 వరకు క్రాల్ చేసిన మొత్తం కంటెంటు యొక్క పూర్తి, నవీనమైన ఇండెక్సు ఉంది. దాన్ని క్రమం తప్పకుండా నవీకరిస్తారు కూడా. క్లాసిక్ వేబ్యాక్ మెషీన్ను నడిపిన ఇండెక్సులో 2008 తరువాతి కంటెంటులో కొంత భాగం మాత్రమే ఉంది. ఈ సంవత్సరం దశలవారీగా తొలగించేందుకు ప్లాను చేసాము కాబట్టి తదుపరి ఇండెక్సు నవీకరణలు చేయము. 2011 లో, ఇంటర్నెట్ ఆర్కైవ్ తమ ఆరవ జత పెటాబాక్స్ రాక్‌లను స్థాపించింది. ఇది వేబ్యాక్ మెషీన్ నిల్వ సామర్థ్యాన్ని 700 టెరాబైట్లు పెంచింది.

జనవరి 2013 లో, సంస్థ 240 బిలియన్ URL ల మైలురాయిని చేరుకున్నట్లు ప్రకటించింది. అక్టోబర్ 2013 లో, సంస్థ "సేవ్ ఎ పేజ్" అనే విశేషాన్ని అందిస్తున్నట్లు ప్రకటించింది ఎవరైనా ఇంటర్నెట్ వాడుకరి ఏదైనా URL లోని విషయాలను ఆర్కైవ్ చేసుకునే వీలు ఈ విశేషం కలిగిస్తుంది.

2014 డిసెంబరు నాటికి, వేబ్యాక్ మెషీన్లో 435 బిలియన్ల వెబ్ పేజీలున్నాయి - ఇంచుమించు 9 పెటాబైట్ల డేటా. వారానికి 20 టెరాబైట్ల చొప్పున పెరుగుతోంది కూడా.

2016 జూలై నాటికి వెబ్యాక్ మెషీన్లో 15 పెటాబైట్ల డేటా ఉండగా, అది 2018 సెప్టెంబరు నాటికి 25 పెటాబైట్లకు చేరింది.



                                     

3. ఉపయోగాలు

2001 లో బహిరంగంగా ప్రారంభించినప్పటి నుండి, వేబ్యాక్ మెషీన్ డేటాను సేకరించే, నిల్వచేసే పద్ధతులపైన, అది సంగ్రహించిన వాస్తవ పేజీల పైనా పండితులు అధ్యయనం చేశారు. 2013 నాటికి, పండితులు వేబ్యాక్ మెషీన్ గురించి 350 వ్యాసాలను వ్రాశారు. ఇవి ఎక్కువగా సమాచార సాంకేతికత, లైబ్రరీ సైన్స్, సాంఘిక శాస్త్ర రంగాలకు చెందినవి. 1990 ల మధ్య నుండి నేటి వరకు వెబ్‌సైటు అభివృద్ధి సంబంధిత సంస్థ అభివృద్ధిని ఎలా ప్రభావితం చేసిందో విశ్లేషించడానికి సాంఘిక శాస్త్ర పండితులు వేబ్యాక్ యంత్రాన్ని ఉపయోగించారు.

వేబ్యాక్ మెషీన్ ఒక పేజీని ఆర్కైవు చేసినప్పుడు, సాధారణంగా ఇది అందులో ఉన్న హైపర్‌లింక్‌లను అలాగే ఉంచుతుంది. ఆన్‌లైన్ పాండితీ ప్రచురణలలో హైపర్‌లింక్‌లను సేవ్ చేయగల వేబ్యాక్ మెషీన్ సామర్థ్యపు ప్రభావాన్ని భారతదేశంలోని పరిశోధకులు అధ్యయనం చేశారు. వాటిలో సగం కంటే కొంచెం ఎక్కువ లింకులను భద్రపరచినట్లు వారు కనుగొన్నారు.

కాలగర్భంలో కలిసిపోయిన వెబ్‌సైట్‌లు, నాటి వార్తా నివేదికలు, వెబ్‌సైట్ విషయాలకు చేసిన మార్పులనూ చూడటానికి జర్నలిస్టులు వేబ్యాక్ మెషీన్‌ను ఉపయోగిస్తారు. రాజకీయ నాయకులను జవాబుదారీగా ఉంచడానికీ, యుద్ధభూమి అబద్ధాలను బహిర్గతం చేయడానికీ కూడా దీని కంటెంట్ ఉపయోగించారు. 2014 లో, ఉక్రెయిన్ లో ఒక వేర్పాటువాద తిరుగుబాటు నాయకుడైన ఇగోర్ గిర్కిన్‌కు చెందిన సామాజిక మీడియా పేజీ యొక్క ఆర్కైవులో, తమ దళాలు అనుమానిత ఉక్రేనియన్ సైనిక విమానాన్ని కూలగొట్టాయని బడాయి కబుర్లు రాసాడు. కానీ నిజానికి కూలిపోయిన విమానం మలేషియా ఎయిర్లైన్స్ ఫ్లైట్ 17 అని తేలిన తరువాత అతను ఈ పోస్టును తొలగించి, మాట మార్చి, ఆ విమానాన్ని ఉక్రెయిన్ సైన్యం కూల్చివేసిందంటూ నిందించాడు. 2017 లో, వాతావరణ మార్పు కు సంబంధించిన అన్ని ప్రస్తావనలనూ వైట్ హౌస్ వెబ్సైట్ నుండి తొలగించారని Archive.org లోని పాత పేజీల్లోని లింకుల ద్వారా కనుగొన్నారు. దీనిపై రెడ్డిట్‌లో జరిగిన చర్చలో స్పందిస్తూ, ఒక అజ్ఞాత వాడుకరి "వాషింగ్టన్ పై సైంటిస్టులు మార్చ్ చెయ్యాలి" అని వ్యాఖ్యానించారు.

                                     

3.1. ఉపయోగాలు పరిమితులు

2014 లో, ఒక వెబ్‌సైటును క్రాల్ చెయ్యడానికీ, వేబ్యాక్ మెషీన్‌లో దాన్ని అందుబాటులో ఉంచడానికీ ఆరు నెలల సమయం పట్టేది. ప్రస్తుతం, ఇది 3 నుండి 10 గంటల వరకూ పడుతోంది. వేబ్యాక్ మెషీన్ పరిమిత శోధన సౌకర్యాలను మాత్రమే అందిస్తుంది. దీని "సైట్ సెర్చ్" అంశం, వెబ్ పేజీలలో కనిపించే పదాల కంటే కూడా సైటును వివరించే పదాల ఆధారంగానే సైటును చూపిస్తుంది.

వేబ్యాక్ మెషీన్‌ వెబ్ క్రాలరుకు కొన్ని పరిమితులున్నాయి. ఇప్పటివరకు అంతర్జాలంలో పుట్టిన ప్రతీ పేజీనీ వేబ్యాక్ మెషీన్‌ ఆర్కైవులో పెట్టలేదు. జావాస్క్రిప్టు ద్వారాను, ఆధునిక వెబ్ అనువర్తనాల ద్వారాను, ఫ్లాష్ ప్లాట్‌ఫారమ్‌లు, ఫారమ్‌ల వంటి ఇంటరాక్టివ్ లక్షణాలను కలిగి ఉన్న వెబ్ పేజీలనూ వేబ్యాక్ మెషీన్ పూర్తిగా ఆర్కైవు చేయలేదు. ఎందుకంటే ఆ ఫంక్షన్లకు హోస్ట్ వెబ్‌సైట్‌తో పరస్పర చర్య ఇంటరాక్టివిటీ అవసరం. వేబ్యాక్ మెషీన్ లోని వెబ్ క్రాలరుకు HTML లేదా దాని వేరియంట్లలో కోడ్ చేయని దేనినైనా సంగ్రహించడంలో ఇబ్బంది ఉంది. అందువలన ఇది తెగిపోయిన హైపర్‌లింకులు, తప్పిపోయిన చిత్రాలకూ దారితీస్తుంది. ఈ కారణంగా, ఇతర పేజీలకు లింకులు లేని "అనాధ పేజీలను" ఈ వెబ్ క్రాలరు ఆర్కైవు చేయలేదు. వేబ్యాక్ మెషీన్ యొక్క క్రాలరు ముందుగా నిర్ణయించిన లోతు పరిమితి ఆధారంగా ముందుగా నిర్ణయించిన హైపర్‌లింక్‌లను మాత్రమే అనుసరిస్తుంది. అందుచేత ఇది ప్రతీ పేజీలోని ప్రతీ హైపర్‌లింకునూ ఆర్కైవు చేయదు.