philomena/lib/philomena_proxy/scrapers/raw.ex

defmodule PhilomenaProxy.Scrapers.Raw do
  @moduledoc false

  alias PhilomenaProxy.Scrapers.Scraper
  alias PhilomenaProxy.Scrapers

  @behaviour Scraper

  @mime_types ["image/gif", "image/jpeg", "image/png", "image/svg", "image/svg+xml", "video/webm"]

  @spec can_handle?(URI.t(), String.t()) :: boolean()
  def can_handle?(_uri, url) do
    PhilomenaProxy.Http.head(url)
    |> case do
      {:ok, %{status: 200, headers: headers}} ->
        headers
        |> Enum.any?(fn {k, v} ->
          String.downcase(k) == "content-type" and String.downcase(v) in @mime_types
        end)

      _ ->
        false
    end
  end

  @spec scrape(URI.t(), Scrapers.url()) :: Scrapers.scrape_result()
  def scrape(_uri, url) do
    %{
      source_url: url,
      author_name: "",
      description: "",
      images: [
        %{
          url: url,
          camo_url: PhilomenaProxy.Camo.image_url(url)
        }
      ]
    }
  end
end
Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`defmodule PhilomenaProxy.Scrapers.Raw do`
			`@moduledoc false`

			`alias PhilomenaProxy.Scrapers.Scraper`
			`alias PhilomenaProxy.Scrapers`

			`@behaviour Scraper`

add scrapers 2019-11-28 18:12:10 +01:00			`@mime_types ["image/gif", "image/jpeg", "image/png", "image/svg", "image/svg+xml", "video/webm"]`

Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`@spec can_handle?(URI.t(), String.t()) :: boolean()`
add scrapers 2019-11-28 18:12:10 +01:00			`def can_handle?(_uri, url) do`
Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`PhilomenaProxy.Http.head(url)`
add scrapers 2019-11-28 18:12:10 +01:00			`\|> case do`
Replace Tesla with Req 2024-06-20 05:03:44 +02:00			`{:ok, %{status: 200, headers: headers}} ->`
add scrapers 2019-11-28 18:12:10 +01:00			`headers`
			`\|> Enum.any?(fn {k, v} ->`
			`String.downcase(k) == "content-type" and String.downcase(v) in @mime_types`
			`end)`

			`_ ->`
			`false`
			`end`
			`end`

Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`@spec scrape(URI.t(), Scrapers.url()) :: Scrapers.scrape_result()`
add scrapers 2019-11-28 18:12:10 +01:00			`def scrape(_uri, url) do`
			`%{`
			`source_url: url,`
Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`author_name: "",`
			`description: "",`
add scrapers 2019-11-28 18:12:10 +01:00			`images: [`
			`%{`
			`url: url,`
Split out HTTP client interaction into PhilomenaProxy namespace 2024-05-25 03:15:05 +02:00			`camo_url: PhilomenaProxy.Camo.image_url(url)`
add scrapers 2019-11-28 18:12:10 +01:00			`}`
			`]`
			`}`
			`end`
run formatter 2020-01-11 05:20:19 +01:00			`end`