Wygląda na to, że problem z kodem alecxe polega na tym, że zwraca on tabelę, która jest bezpośrednim rodzeństwem h2, ale ta, którą chcesz, znajduje się w div (czyli rodzeństwie h2). To zadziałało dla mnie:
import requests
from bs4 import BeautifulSoup
urls = [
'https://www.hl7.org/fhir/valueset-account-status.html',
'https://www.hl7.org/fhir/valueset-activity-reason.html',
'https://www.hl7.org/fhir/valueset-age-units.html'
]
def extract_table(url):
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
div = h2.find_next_sibling('div')
return div.find('table')
for url in urls:
print extract_table(url)