Как вытащить ссылку из html и отдать её в плеер (bash скрипт)

Linux bash

Сам скрипт почти готов и имеет такой вид:

#!/bin/bash

player="smplayer"
file="$1"

link=$(cat $file | grep http:// | grep mp4 | awk -F ',' '{ print $1 }' | awk '{ print $2 }' )
$player $link

но вывод переменной $link не идеальный и оставляет двойные скобки в ссылке из-за чего все плееры её не загружают.
После парсинга html файла с помощью grep получается такой вывод:

user@finn-desktop:~$ cat page.htm | grep http:// | grep mp4
file: "http://serials.tulavideo.net/CM/CM-01-01.mp4",
user@finn-desktop:~$

а после добавления команды awk (что она делает я не знаю, просто стащил с другого скрипта) строчка получает такой вид:

user@finn-desktop:~$ cat page.htm | grep http:// | grep mp4 | awk -F ',' '{print $1}' | awk '{ print $2 }'
"http://serials.tulavideo.net/CM/CM-01-01.mp4"
user@finn-desktop:~$

Как избавиться от двойных скобок в ссылке? Или как правильно распарсить страницу?

Примечание:
> и причем тут HTML?
В принципе не причем... но технически я имею дело с html файлом.

Примечание:
> А если речь про кавычки, так с ними проблем не бывало. У mplayer'а уж точно.
Точно, кавычки )) Totem и SMplayer не хотят кушать ссылки с кавычками и говорят следующее:

user@finn-desktop:~$ sh vid.sh page.htm
** Message: Error: Ресурс не найден.
gstfilesrc.c(1055): gst_file_src_start (): /GstPlayBin2:play/GstURIDecodeBin:uridecodebin0/GstFileSrc:source:
No such file "/home/user/"http:/serials.tulavideo.net/CM/CM-01-01.mp4""

а при убирании кавычек все в норме.

Примечание:
Если totem'у так задать:

user@finn-desktop:~$ totem "http://serials.tulavideo.net/CM/CM-01-01.mp4"

то проблем нет, грузит-играет, а в скрипте не хочет...

Примечание:
Добавил echo перед последней строчкой, получил такой вывод:

user@finn-desktop:~$ sh vid.sh page.htm
totem "http://serials.tulavideo.net/CM/CM-01-01.mp4"

вроде ничего криминального, но работать не хочет.

Можете сами убедиться http://dl.dropbox.com/u/1577199/vid.tar.gz (в архиве страница и скрипт)

Примечание:
Pharmakis, как нет запятой? Посмотрите первый вывод grep, в конце как раз есть запятая.
Про плееры и кавычки: методом проб и ошибок было выявлено почему плееры не подхватывают ссылки, а потому что ни пойми как на выходе стандартные двойные кавычки «"» еще раз выделяются одинарными «'». И на такую ссылку:
'"http://serials.tulavideo.net/CM/CM-01-01.mp4"'
даже wget ругается, не то что плееры. Вот почему необходимо как-то удалить двойные.
Ответы:
и причем тут HTML?
Не вижу ни двойных, ни одиночных скобок в выводе.
А если речь про кавычки, так с ними проблем не бывало. У mplayer'а уж точно.
user@laptop:~$ mplayer "http://serials.tulavideo.net/CM/CM-01-01.mp4"
MPlayer 1.0rc2-4.2.3 (C) 2000-2007 MPlayer Team
CPU: Intel(R) Pentium(R) M processor 1.86GHz (Family: 6, Model: 13, Stepping: 8)
CPUflags:  MMX: 1 MMX2: 1 3DNow: 0 3DNow2: 0 SSE: 1 SSE2: 1
Compiled with runtime CPU detection.
mplayer: could not connect to socket
mplayer: No such file or directory
Failed to open LIRC support. You will not be able to use your remote control.
Попробовал smplayer — без проблем.
Про awk: awk это то, что собственно реализует ваш парсинг. (скриптовый язык для разбора структурированных файлов)
Про кавычки: mplayer, totem едят кавычки.
Мне откровенно кажется странным вот этот кусочек awk -F ',' '{print $1}' | awk '{ print $2 }'
F задает разделитель, по которому будут резаться записи на поля, если это делается с 1 ссылкой то не вижу смысла, так как ни одной запятой у вас там нет..
Дописать  sed s/\"//g чтобы убить кавычки


14 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.