If-Koubou

Bangun Penjadwal Unduhan dengan Skill Pemrograman Kecil

Bangun Penjadwal Unduhan dengan Skill Pemrograman Kecil (Bagaimana caranya)

Kami semua suka mengunduh barang dari internet, dan ada banyak alat pengunduh unduhan hebat yang dapat kami gunakan untuk menjadwalkan unduhan kami. Mungkin lebih mudah menggunakan pengelola unduhan, tetapi tidak ada salahnya menjelajahi alat yang sudah ada di Ubuntu dan memanfaatkannya sepenuhnya.

Dalam artikel ini kami akan menunjukkan kepada Anda perangkat lunak bawaan di Ubuntu yang dapat kami gunakan untuk mengunduh barang dari internet menggunakan wget. Di atas itu kami akan menunjukkan cara menjadwalkan unduhan menggunakan Cron.

Unduh Menggunakan Wget

Wget adalah paket perangkat lunak gratis untuk mengambil file menggunakan HTTP, HTTPS dan FTP, protokol Internet yang paling banyak digunakan. Ini adalah alat baris perintah non-interaktif, sehingga dapat dengan mudah dipanggil dari skrip, tugas cron, terminal tanpa dukungan X-Windows, dll.

Buka terminal Anda dan mari kita jelajahi cara menggunakan wget untuk mengunduh barang dari internet. Sintaks dasar mengunduh dengan wget adalah sebagai berikut:

wget [option]… [URL]…

Perintah ini akan mengunduh manual wget ke dalam drive lokal Anda

wget http://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu hadir dengan daemon cron yang digunakan untuk menjadwalkan tugas-tugas yang akan dieksekusi pada waktu tertentu. Crontab memungkinkan Anda menentukan tindakan dan waktu yang harus dieksekusi. Ini adalah bagaimana Anda biasanya menjadwalkan tugas menggunakan alat baris perintah.

Buka jendela terminal dan masukkan crontab -e.

Setiap bagian dalam crontab dipisahkan oleh spasi, dengan bagian akhir memiliki satu atau beberapa ruang di dalamnya. Entri cron terdiri dari menit (0-59), jam (0-23, 0 = tengah malam), hari (1-31), bulan (1-12), hari kerja (0-6, 0 = Minggu), perintah. Entri ketiga di download crontab di atas wget.pdf pada jam 2 pagi. Entri pertama (0) dan entri kedua (2) berarti 2:00. Entri ketiga hingga kelima (*) berarti setiap saat, hari, bulan, atau minggu. Entri terakhir adalah perintah wget untuk mengunduh wget.pdf dari URL yang ditentukan.

Itu adalah dasar dari wget dan bagaimana Cron bekerja. Mari kita menjarah pada contoh kehidupan nyata tentang cara menjadwalkan unduhan.

Penjadwalan Unduh

Kami akan mengunduh Firefox 3.6 pada pukul 2 pagi. Karena ISP kami hanya memberikan jumlah data yang terbatas, kami harus menghentikan unduhan pada jam 8 pagi. Seperti inilah pengaturannya.

Abaikan 2 entri pertama di crontab di atas. Perintah ketiga dan keempat adalah hanya 2 perintah yang Anda butuhkan. Perintah ketiga mengatur tugas yang akan mengunduh Firefox pada pukul 2 pagi:

[kode]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/kode]

Opsi -c menunjukkan bahwa wget akan melanjutkan unduhan yang ada jika belum selesai.

Perintah keempat akan berhenti pada jam 8 pagi. 'Killall' adalah perintah unix yang membunuh proses dengan nama.

[kode]
0 8 * * * killall wget
[/kode]

Killall wget memberitahu Ubuntu untuk berhenti melakukan download file pada jam 8 pagi.

Perintah wget berguna lainnya

1. Menentukan direktori untuk mengunduh file

[kode]
wget -output-document = / home / zainul / Unduh / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/kode]

opsi -output-document memungkinkan Anda menentukan direktori dan nama file yang Anda unduh

2. Mengunduh situs web

wget juga mampu mengunduh situs web.

[kode]
wget -m http://www.google.com/profiles/zainul.franciscus
[/kode]

Perintah di atas akan mengunduh seluruh halaman web profil Google saya. Opsi '-m' memberi tahu wget untuk mengunduh gambar 'cermin' dari URL yang ditentukan.

Pilihan penting lainnya adalah memberi tahu berapa banyak tautan yang harus diikuti ketika mengunduh sebuah situs web.

[kode]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/kode]

Perintah wget di atas menggunakan dua opsi. Opsi pertama '-r' memberitahu wget untuk mengunduh situs web yang ditentukan secara rekursif. Opsi kedua '-l1' memberi tahu wget untuk hanya mendapatkan tingkat tautan pertama dari situs web yang ditentukan. Kami dapat mengatur hingga tiga level '-l2' dan '-l3'.

3. Mengabaikan entri robot

Master web mempertahankan file teks yang disebut Robot.txt. 'Robot.txt' menyimpan daftar URL bahwa perayap halaman web seperti wget tidak boleh dirayapi. Kita dapat memberitahu wget untuk mengabaikan opsi 'Robot.txt' dengan opsi '-erobots = off'. Perintah berikut memberitahu wget untuk mengunduh halaman pertama dari profil google saya dan mengabaikan 'Robot.txt.

[kode]
wget -erobots = off http://www.google.com/profiles/zainul.franciscus
[/kode]

Pilihan lain yang berguna adalah -U. Opsi ini akan menutupi wget sebagai browser. Perhatikan bahwa menyembunyikan aplikasi sebagai aplikasi lain mungkin melanggar persyaratan dan layanan dari penyedia layanan web.

[kode]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/kode]

Kesimpulan

Wget adalah paket perangkat lunak GNU yang sangat tua namun dapat diretas yang dapat kita gunakan untuk mengunduh file. Wget adalah alat baris perintah interaktif yang artinya kita dapat membiarkannya berjalan di komputer kita di latar belakang tanpa harus memulai aplikasi apa pun. Lihat halaman manual wget

[kode]
$ man wget
[/kode]

untuk memahami opsi lain yang bisa kita gunakan dengan wget.

Tautan

Wget Manual
Cara Menggabungkan Dua File Yang Diunduh Saat Wget Gagal Di Tengah Jalan
Linux QuickTip: Mengunduh dan Menghapus jejak dalam Satu Langkah